Hallo zusammen,
ich versuche verzweifelt einen Regulären Ausdruck für folgende Sachlage zu finden:
Mir liegt ein Textdokument mit mehreren Hunderttausend an Datensätzen vor, die wiederum jeweils mehrere Metadatenfelder besitzen.
Es geht um Angaben wie Titel einer Publikation, die Autoren, Erscheinungsjahr etc.
Nun möchte ich die Semikolons aus den Metadatenfeldern entfernen, die Mehrfacheinträge enthalten - z.B. bei den Autoren.
Ersetzt werden sollen sie durch etwas wie "Autor_1", "Autor_2" usw., wobei natürlich die Namen der Autoren erhalten bleiben, aber eben nummeriert werden sollen.
Die jeweilige Zeile (das Metadatenfeld) der Autoren wird abgekürzt mit "AU".
Ich würde mich über jeden Tipp wirklich sehr freuen.
SHS
ich versuche verzweifelt einen Regulären Ausdruck für folgende Sachlage zu finden:
Mir liegt ein Textdokument mit mehreren Hunderttausend an Datensätzen vor, die wiederum jeweils mehrere Metadatenfelder besitzen.
Es geht um Angaben wie Titel einer Publikation, die Autoren, Erscheinungsjahr etc.
Nun möchte ich die Semikolons aus den Metadatenfeldern entfernen, die Mehrfacheinträge enthalten - z.B. bei den Autoren.
Ersetzt werden sollen sie durch etwas wie "Autor_1", "Autor_2" usw., wobei natürlich die Namen der Autoren erhalten bleiben, aber eben nummeriert werden sollen.
Die jeweilige Zeile (das Metadatenfeld) der Autoren wird abgekürzt mit "AU".
Ich würde mich über jeden Tipp wirklich sehr freuen.
SHS