OCR-Software gesucht

Oakman

Ensign
Registriert
Mai 2006
Beiträge
216
Hallo,

Ich suche ein OCR-Programm, dass in eingescannten .pdfs eine Texterkennung durchführt und etwaige Scanfehler (z. B. ein leicht schiefes Dokument) korrigiert. 500 € für die Adobe Acrobat Pro Lizenz würde ich ungern bezahlen.

Hat jemand einen Tip?

Besten Dank!
 
cartridge_case schrieb:

Mit überwiegender Wahrscheinlichkeit habe ich schon Internet-Suchmaschinen (damals AltaVista) bedient, als du noch nackig mit einem Trömmelchen um den Weihnachtsbaum gerannt bist.

Google spuckt einem einen Haufen Programme aus, die alle mehr oder weniger geeignet zu sein scheinen, ohne dass man jetzt ableiten könnte, welches davon was taugt und welches nicht.

Ich hatte ehrlichgesagt auf einen Einzeiler der Art "Programm XXX benutze ich seit 3 Jahren genau für den Zweck und es tut was es soll" gehofft...
 
Oakman schrieb:
dass in eingescannten .pdfs eine Texterkennung durchführt

Warum PDF einscannen? PDF wenn vernuenftig erstellt sind schon durchsuchbar. ;)

Schau Dir Abbyy FineReader an oder Microsoft Office Lens fuer's TatschFone.

Abgesehen davon.
Meist haben die Ergebnisse der Suchmaschinen-Suche auch eine Trial im Angebot.
Das war schon vor AltaVista so. :D

Und woher soll hier einer wissen was Du schon ausprobiert hast.
Hat Deine mitgeliferte Scannersoftware nicht solch Krams inkludiert? Ist bei meinem Canon und Brother so.

BFF
 
Zuletzt bearbeitet:
Tesseract von Google. Geht recht einfach in der Konsole zu bedienen und unterstützt glaub ich auch pdf Dateien wenn ich mich nicht täusche.

https://github.com/UB-Mannheim/tesseract/wiki

Gimagereader basiert auch darauf glaub ich.
 
BFF schrieb:
Warum PDF einscannen?
Weil es durchaus PDF-Dateien gibt, in denen auch der Text als Image hinterlegt ist. Wenn man nicht der Ersteller der PDF-Datei ist, bleibt nur eine Texterkennung, um dies zu ändern.

Ich nutze für so etwas den Finereader. Allerdings kann ich nicht wirklich einschätzen, ob der gut darin ist, dafür stehe ich zu selten vor diesem Problem.

Oakman schrieb:
Mit überwiegender Wahrscheinlichkeit habe ich schon Internet-Suchmaschinen (damals AltaVista) bedient, als du noch nackig mit einem Trömmelchen um den Weihnachtsbaum gerannt bist.
Mit solchen Äußerungen sollte man sich in öffentlichen Foren zurück halten. Es gibt durchaus Poster, die deutlich älter als das Internet sind.
 
Andreas_ schrieb:
Weil es durchaus PDF-Dateien gibt, in denen auch der Text als Image hinterlegt ist.

Das waere aber kein Scannen mehr sondern schon OCR, oder? ;)

Anyway.
Mit dem Abbyy FineReader macht man eigentlich nix verkehrt. Macht richtig Spass wenn man Duplex-Dokumenteneinzug hat. Die OCR ist ganz vernuenftig und das automatische Freistellen/Auslassen von Bildern im Material klappt auch. Und es gibt eine Probierversion. :D

-> https://www.abbyy.com/de-de/finereader/

Sehe gerade, dass die mittlerweile auch mobile Apps anbieten. Muss ich der Tage mir mal reinziehen.

https://www.abbyy.com/de-de/mobile/

Ansonsten waere da noch NAPS2 (OCR basiert auf Tesseract). Allerdings ist damit nix mit Bilder gerade ruecken.

-> https://www.naps2.com/

BFF
 
Zuletzt bearbeitet: (Typo / Ergaenzt)
Zurück
Oben