Excel - Daten importieren aus unformatierten txt-File

RolandR88

Lieutenant
Registriert
Jan. 2007
Beiträge
731
Hallo Leute,

ich habe aktuell das Problem, dass ich Daten aus einem Uralt-Bericht analysieren möchte. Dieser Bericht kommt in Form einer Liste, die leider weder CSV/TSV noch sonst wie strukturiert ist. Das Einzige was bisher annähernd funktioniert hat, war die Datei über fixe Tabs (Text in Spalten) so grob auf ein Sheet aufzuteilen. Dabei ist aber das größte Problem, dass die Datensätze immer in zwei Zeilen zusammenhängen, wodurch ein Filtern unmöglich wird, da jeder Filter zwar die erste Zeile als Pfuschlösung ausfiltern kann, die relevanten Daten in der zweiten Zeile jedoch dann fehlen.
Leider kann ich keine Beispieldatei uploaden, da es sich um strengst vertrauliche Akten handelt, vom Aufbau her sieht die Sache so aus wie das PNG anbei.
Hat jemand eine Idee wie man das intelligent angehen könnte?
Vielen Dank im Voraus und LG
 

Anhänge

  • qEvuYKLfZW8yERIrVdNKnzQS8WeOBqkUWg.png
    qEvuYKLfZW8yERIrVdNKnzQS8WeOBqkUWg.png
    141,4 KB · Aufrufe: 315
Du könntest ja mal mit Notepad++ versuchen im Suchmodus "Erweitert" im Suchen und ersetzen die Datensätze in eine Zeile zu bringen. Ich geh aber mal davon aus, dass die Datensätze nicht immer ähnlich aufgebaut sind und daher mein Ansatz zu leicht gedacht ist.
 
Zer0DEV schrieb:
Du könntest ja mal mit Notepad++ versuchen im Suchmodus "Erweitert" im Suchen und ersetzen die Datensätze in eine Zeile zu bringen. Ich geh aber mal davon aus, dass die Datensätze nicht immer ähnlich aufgebaut sind und daher mein Ansatz zu leicht gedacht ist.

Das sieht alles sehr kontextsensitiv aus, daher wird das kontextfreien Suchen und Ersetzen bestimmt nichts werden.

Wahrscheinlich sollte sich der TO am besten jemanden suchen der das für $$$ erledigt.
 
foofoobar schrieb:
Das sieht alles sehr kontextsensitiv aus, daher wird das kontextfreien Suchen und Ersetzen bestimmt nichts werden.

Wahrscheinlich sollte sich der TO am besten jemanden suchen der das für $$$ erledigt.
Ja, das DIng ist eben, dass das wahrscheinlich eine monatliche Kontrollaufgabe in meinem Business wird und ich von der alten Datenquelle nicht wegkomme. Einen Parser programmieren zu lassen erscheint mir aufgrund der Aufwendigkeit eine adäquate Lösung zu sein. Suchen und Ersetzen war auch so ein Mittel der Wahl bis dato... STRG+H sag ich nur...
 
@RolandR88
Die optimalste Lösung wäre, wenn du an das Quellsystem kommen könntest, welches diese Berichte generiert. Das wäre wesentlich effizienter und zielführender, als das Parsen und Basteln an den Textdateien.
 
G-Red schrieb:
@RolandR88
Die optimalste Lösung wäre, wenn du an das Quellsystem kommen könntest, welches diese Berichte generiert. Das wäre wesentlich effizienter und zielführender, als das Parsen und Basteln an den Textdateien.
Absolut korrekt! Wenn ich an das Quellsystem käme, dann würde ich hier keine dummen Fragen mehr stellen, nennen wir's mal so :)
 
RolandR88 schrieb:
Absolut korrekt! Wenn ich an das Quellsystem käme, dann würde ich hier keine dummen Fragen mehr stellen, nennen wir's mal so :)
"Die dümmste Frage ist die, die nicht gestellt wurde" hat uns immer einer unserer Profs eingeschärft. Daher alles gut.

Wo liegt den das Problem, weshalb du da dran nicht kommst? Gibt es den die Möglichkeit dich an die IT zu wenden, mit der Bitte dir eine Datenbank View zu erstellen die dir die benötigten Daten zur Verfügung stellt?
 
Nein, leider nicht möglich. Gibt es ein Parsing Tool, sowas wie XL-Parser, womit ich die Routine abbilden könnte?
 
Wenn du eine Parser programmiern willst - wie zum Kuckuck sind die Rohdaten strukturiert?

Da muss es doch Regeln geben. Wenn nicht CSV dann SSV (T ist es ja nicht), sind es feste Spaltenbreiten?
Haben Gruppen von Zeilen [eines Datensatzes] eine Struktur die ein Makro aufdröseln könnte? Sind es mehr als ein Trennzeichen?

CN8
 
Ganz einfach, das bekommst Du mit Umwandeln in andere Zwischendateien oder im Speicher gut hin
  • 2 Zeilen zu einer zusammenfassen
  • Spaltenwerte zu einer Zeichenkette zusammenfassen mit ""
  • Dann einfach zwischen jedem Spaltenwert ein Delimiter setzen, z.B. ; wie in CSV-Dateien
Und schon kannst Du diese CSVs in Excel, in eine Datebank oder sonstwas importieren. Ein guter Scripter oder Programmierer mach das in 5-10 min. Man kann das mit einem Programm, oder mit mehreren verschiedenen Programme als "Vorverarbeitung" lösen.
 
RolandR88 schrieb:
Nein, leider nicht möglich. Gibt es ein Parsing Tool, sowas wie XL-Parser, womit ich die Routine abbilden könnte?

Evtl. gibt es ETL Tools mit denen man so was zusammenklicken kann, die Dinger sind im Regelfall ziemlich bloatig. Mach eine vernünftige, nachvollziehbare und vollständige Beschreibung was im Input steht und wie das zu foo gewandelt werden soll, und miete dir ein anderes Gehirn für die Implementierung.

Achtung: Gerne tauchen später in solchen Listen Cornercases auf die erst später ergänzt werden können, und Klickibunti Tools werden bei Cornercases wahrscheinlich komplett verkacken.
 
Zuletzt bearbeitet:
foofoobar schrieb:
Evtl. gibt es ETL Tools mit denen man so was zusammenklicken kann, die Dinger sind im Regelfall ziemlich bloatig.
:
Achtung: Gerne tauchen später in solchen Listen Cornercases auf die erst später ergänzt werden können, und Klickibunti Tools werden bei Cornercases wahrscheinlich komplett verkacken.
Da bin ich jetzt anderer Meinung, immerhin bediene und installiere ich permanent solch ein ETL Tool. Ja, für so einen Fall wäre das was vielleicht. Aber muß damit schon etwas zu tun haben, der Einstieg ist hier nicht so ganz einfach.
 
Zurück
Oben