WulfmanGER
Commander
- Registriert
- Juli 2005
- Beiträge
- 2.326
Hallo zusammen,
die IMBD stellt ja paar Datenbankauszüge als TSV (Tabbed-Seperated) zur verfügung. Irgendwie ist mir CSV lieber (bekomme ich besser in mySQL importiert) zudem hab ich ein Problem mit den dortigen Zeilensprungverfahren...
Aktuell nutze ich unter Win zum Konvertieren notepad++:
1) Suchmodus "Erweitert": Zeilensprung ändern (\n zu \r\n )
2) Suchmodus "Normal" Copy&Paste eines "tabs" und durch ; ersetzen
Jetzt geht es um einen Datensatz der flockige 1 Mio-Datensätze hat (einer der kleineren IMDB...). #1 macht 1 Mio auführungen werden und #2 sogar 2 Mio (2 Tabs je Zeile die durch ; ersetzt werden müssen). Mein 2700x braucht hier leider doch verhältnismässig lang ... und ich hab durchaus noch interesse an den wirklich großen Datensätzen der IMDB...
Jetzt nutze ich unter Windows WSL und somit die möglichkeit ein Bash-Script zu schreiben was für mich konvertiert. Google ist mein Freund - aber in dem Fall ist Google eher der Freund von mehreren Seiten "TSV-to-CSV"-Webconverter![Traurig :( :(](/forum/styles/smilies/frown.gif)
Komme da leider nicht so wirklich weiter, da mir bisher jeglicher Ansatz fehlt. Grundsätzlich etwas erfahrung in Bash hab ich schon (ich liebe WSL - macht Windows so viel einfacher) - aber das bezieht sich vorwiegend darum im Grafik/PDF/ZIP-Bereich Dateiheader auszulesen/manipulieren, Bestimmte Aktionen in Schleifen ausführen etc. Aber bisher ist das Thema: Dateiinhalt ("Plaintext") zu ändern noch völlig fremd. Stehe aber immer wieder vor der Frage wie ich da etwas verarbeite.
Danke schon mal für Anregungen![Zwinkern ;) ;)](/forum/styles/smilies/wink.gif)
PS: das TSV direkt über phpMyAdmin in die mySQL einzulesen wäre zwar auch nett ... aber wo bleibt der Bash-Lerneffekt?
.
die IMBD stellt ja paar Datenbankauszüge als TSV (Tabbed-Seperated) zur verfügung. Irgendwie ist mir CSV lieber (bekomme ich besser in mySQL importiert) zudem hab ich ein Problem mit den dortigen Zeilensprungverfahren...
Aktuell nutze ich unter Win zum Konvertieren notepad++:
1) Suchmodus "Erweitert": Zeilensprung ändern (\n zu \r\n )
2) Suchmodus "Normal" Copy&Paste eines "tabs" und durch ; ersetzen
Jetzt geht es um einen Datensatz der flockige 1 Mio-Datensätze hat (einer der kleineren IMDB...). #1 macht 1 Mio auführungen werden und #2 sogar 2 Mio (2 Tabs je Zeile die durch ; ersetzt werden müssen). Mein 2700x braucht hier leider doch verhältnismässig lang ... und ich hab durchaus noch interesse an den wirklich großen Datensätzen der IMDB...
Jetzt nutze ich unter Windows WSL und somit die möglichkeit ein Bash-Script zu schreiben was für mich konvertiert. Google ist mein Freund - aber in dem Fall ist Google eher der Freund von mehreren Seiten "TSV-to-CSV"-Webconverter
![Traurig :( :(](/forum/styles/smilies/frown.gif)
Komme da leider nicht so wirklich weiter, da mir bisher jeglicher Ansatz fehlt. Grundsätzlich etwas erfahrung in Bash hab ich schon (ich liebe WSL - macht Windows so viel einfacher) - aber das bezieht sich vorwiegend darum im Grafik/PDF/ZIP-Bereich Dateiheader auszulesen/manipulieren, Bestimmte Aktionen in Schleifen ausführen etc. Aber bisher ist das Thema: Dateiinhalt ("Plaintext") zu ändern noch völlig fremd. Stehe aber immer wieder vor der Frage wie ich da etwas verarbeite.
Danke schon mal für Anregungen
![Zwinkern ;) ;)](/forum/styles/smilies/wink.gif)
PS: das TSV direkt über phpMyAdmin in die mySQL einzulesen wäre zwar auch nett ... aber wo bleibt der Bash-Lerneffekt?
![Zwinkern ;) ;)](/forum/styles/smilies/wink.gif)