Hallo!
Ich hab folgendes Problem: Ich lasse von einem Programm mehrere Textdateien einlesen und davon sollen dann die einzelnen Datensätze in einer Datenbank gespeichert werden. Vorher soll allerdings überprüft werden, ob man quasi alles richtig geschrieben hat. Also, wenn irgendwo in der Datenbank ein Ort namens "Osnabrück" drinne steht, aber "Osnabrueck" als neuer Datensatz eingetragen werden soll, dann soll nachgefragt werden, ob man nicht "Osnabrück" gemeint hat (ähnlich wie bei Google). Wie macht man sowas? Mich interessiert jetzt erstmal nur der Algorithmus, unabhängig von einer Programmiersprache. Ich habe schon erst an den Hamming-Abstand gedacht, allerdings funktioniert der ja glaube ich nur, wenn die beiden Wörter gleich lang sind. Also wer weiß das?
Ich hab folgendes Problem: Ich lasse von einem Programm mehrere Textdateien einlesen und davon sollen dann die einzelnen Datensätze in einer Datenbank gespeichert werden. Vorher soll allerdings überprüft werden, ob man quasi alles richtig geschrieben hat. Also, wenn irgendwo in der Datenbank ein Ort namens "Osnabrück" drinne steht, aber "Osnabrueck" als neuer Datensatz eingetragen werden soll, dann soll nachgefragt werden, ob man nicht "Osnabrück" gemeint hat (ähnlich wie bei Google). Wie macht man sowas? Mich interessiert jetzt erstmal nur der Algorithmus, unabhängig von einer Programmiersprache. Ich habe schon erst an den Hamming-Abstand gedacht, allerdings funktioniert der ja glaube ich nur, wenn die beiden Wörter gleich lang sind. Also wer weiß das?