Guten Tag liebe Community,
ich plane momentan ein Projekt (C#), welches meine Textdokumente, darunter PDFs, E-Books u.ä., durchsucht.
Die Idee: Stichwort eingeben und die Ausgabe gibt an, welches Dokument das gesuchte Wort auf welcher Seite enthält. Es ist mir bewusst, dass es schon Programme gibt, die dieses tun, aber ich mache es aus Interesse und zu Übungszwecken.
Jetzt stehe ich vor der Frage, welches die effektivste Methode ist, diese Wörter als Zeichenkette zu speichern, um sie daraufhin zu durchsuchen.
Eine Idee war, XML-Dokumente zu erstellen, welche mir eine Art Wörterbuch erstellen.
Jedes Wort als XML-Element enthält als Child-Elemente Bücher, diese jeweils wieder Child-Elemente der Seiten, auf denen das Wort steht.
Jetzt stelle ich mir die Frage, ob diese Methode sinnvoll ist.
Was haltet ihr als Vollprofies davon?
Habt ihr bessere Vorschläge? Datenbank? Andere Dateiformate? Oder was ganz anderes?
Vielen Dank für eure Hilfe.
Agredo
ich plane momentan ein Projekt (C#), welches meine Textdokumente, darunter PDFs, E-Books u.ä., durchsucht.
Die Idee: Stichwort eingeben und die Ausgabe gibt an, welches Dokument das gesuchte Wort auf welcher Seite enthält. Es ist mir bewusst, dass es schon Programme gibt, die dieses tun, aber ich mache es aus Interesse und zu Übungszwecken.
Jetzt stehe ich vor der Frage, welches die effektivste Methode ist, diese Wörter als Zeichenkette zu speichern, um sie daraufhin zu durchsuchen.
Eine Idee war, XML-Dokumente zu erstellen, welche mir eine Art Wörterbuch erstellen.
Jedes Wort als XML-Element enthält als Child-Elemente Bücher, diese jeweils wieder Child-Elemente der Seiten, auf denen das Wort steht.
Jetzt stelle ich mir die Frage, ob diese Methode sinnvoll ist.
Was haltet ihr als Vollprofies davon?
Habt ihr bessere Vorschläge? Datenbank? Andere Dateiformate? Oder was ganz anderes?
Vielen Dank für eure Hilfe.
Agredo