Gescanntes PDF in "durchsuchbares" PFD umwandeln

Mattes_01

Cadet 4th Year
Registriert
Juni 2011
Beiträge
91
Hallo zusammen,

ich wollte mal fragen, ob es ein Konvertierungsprogramm gibt, das man quasi ueber ein pdf drueberlaufen lassen kann und das dann eine Texterkennung durchfuehrt.

Das Ergebnis muss nicht perfekt sein, es gibt einige Grafiken etc, d.h. das Ergebnis kann garnicht perfekt sein, aber man kann ja beide (das Originale und das Konvertierte) benutzen, in dem Konvertierten suchen und in dem originalen dann schoen lesen.

Womit kann man sowas machen? Hat da einer eine Idee?

Die Seiten sind teilweise etwas schraeg eingescannt (unter 5 Grad Drehung) und eben altes Papier etc.

Vielleicht hat da ja jemand eine Idee :)

Lieber Gruss vom
Mattes
 
Nennt sich optische Zeichenerkennung oder auch kurz OCR. Software die das kann findest du hier.
Einige Scanner und Multifunktionsgeräte bringen aber auch schon OCR-Software mit.
 
Sowas nennt sich OCR (Optical Character Recognition). Google mal danach, "gute" Software wirst du damit aber wohl nicht finden.
 
wenn es nur ums reine Suchen geht und nicht ums umwandeln, dann kann ich dir von Adobe ein Plugin für die Windows Suche empfehlen. Windows indiziert mit seinem Indexdienst ja bereits eine Vielzahl an Dateitypen, pdf ist aber bis jetzt noch nicht darunter. Das Adobe Plugin holt dies nach. Anschließend kannst du über die gewohnte Windows Suche auch nach Inhalten innerhalb von pdf Dateien suchen.
 
Hallo und danke fuer die vielen Antworten!

Das Problem ist, dass ich dieses Plugin nicht auf dem Rechner installieren kann, auf dem ich die Suche aber benoetige (ArbeitsPC).

Von daher wuerde ich das pdf gerne umwandeln.

Ich habe so eine Handschrifterkennungssoftware (MyScribe) und das funktioniert erstaunlich gut.
Von daher dachte ich, dass es da eine gute OCR Software geben muss.

Oder taeusche ich mich da?
 
Yuuri schrieb:
...Google mal danach, "gute" Software wirst du damit aber wohl nicht finden.

Wie kann man das verstehen? Weils der falsche Suchbegriff ist oder weils einfach keine brauchbare Software in dem Bereich gibt? Sind "FineReader" oder "OmniPage" Schrott? Was sollte man deiner Meinung nach sonst benutzen?
 
Damit meine ich, dass ich noch keine Software gefunden habe, die alles ordentlich erkennt. Was bringt mir eine OCR Software, wenn ich davon 25 Prozent oder mehr selbst nachbessern darf? Klar, besser als nichts, aber imho zwecklos. Kommt natürlich auf das Quellmaterial an, sowie müssen die Ansprüche stimmen.
 
Abby Fine Reader worked :) N Kumpel hatte das Proggi.

Das ist ein 60 Jahre altes technisches Buch. Klar ist due Quali schlecht, aber die Textbloecke werden erkannt. Und das ist das, worauf es ankommt.
Jettz habe ich 2 Dokumente, in dem einen suche ich was und wenn ich dann die Seite habe, dann geh ich in das andere und lese das da nach :)

Danke sehr
 
Zurück
Oben