Buchausschnitte in pdf scannen mit Smartphone - Vorbereitung OCR

andydomingo

Cadet 1st Year
Registriert
Jan. 2011
Beiträge
15
Ich habe bislang noch nicht die geeigneten Lösungen gefunden für mein Vorhaben:
Ich möchte Teile von Büchern einscannen, in pdf umwandeln und diese dann per OCR umwandeln.

OCR soll das Smartphone nicht erledigen, dies geschieht am Desktop. Das Smartphone soll aber:

- möglichst nicht allzu große Dateien auswerfen (Weiterverarbeitung sonst schwierig, wenn jede Einzelseite schon 5 MB groß ist)
- andererseits die Qualität aber nicht zu stark leiden lassen.

ICh habe schon viele Apps probiert. Camscanner und auf Android Mobile Document Scanner helfen zum Teil.
Mein Problem ist aber:
entweder ist die QUalität für OCR zu schlecht oder
die Dateien sind zu groß.

Alle Versuche, mit der Acrobat Vollversion die Größe zu reduzieren, scheitern.

Ich würde mich über Tipps freuen insb. zu folgenden Fragen:

1. Welche Auflösung ist das beste Größe-zu-Qualität-Verhältnis für OCR? Klar, je größer, desto besser OCR, aber mit welcher Auflösung erhält man typischerweise noch gute Werte (ich neige zu 1024*768, bin aber nicht sicher)?

2. Ich wäre auch bereit, am Smartphone eine große Datei zu produzieren, wenn ich am PC diese sicher klein bekäme. Ginge nicht folgendes.

HOchauflösende Datei (zB 12 Mpixel iPHone 8-Kamera) am Smartphone. Dann am PC reduzieren (zB durch: Farbumwandlung in Schwarz-Weiß). Gibt es eine App, die zB die Größe der Datei um 80 Prozent reduziert, aber dennoch OCR ermöglicht? Ginge das nicht durch Umwandlung einer Farbdatei in Schwarzweiß? Können so etwas vielleicht Grafikprogramme wie Photoshop oder Corel Draw?

Für Tipps wäre ich dankbar.
Gruß
Andydomingo
 
Dürfte es nicht einfacher sein, wenn du die Seiten auf eine Scanner mit OCR-fähigen Scanprogramm (das können heute die meisten AIOs) scannst?

Ansonsten würde ich 1 MB große Fotos erzeugen, diese auf dem PC per Bilddruck in eine große pdf umwandeln und dann einem OCR-Programm zuführen.
Alternativ kanst du die Dateien auch mit IrfanView im Batchmodus komprimieren.
 
Wieso so umständlich denken? Handy App von Adobe Scan nutzen, direkt per Cloud Sync fertig. Wieso manuell alle Dateien verschieben. Text-Erkennung ist ähnlich genug wie in Acrobat selber (würde mich auch nicht wundern, wen viele Entwickler auf das selbe Erkennungs-Muster zurückgreifen) und bei OCR ist es eh nicht 100% Sicher ob er den Text 1:1 wieder erkennt, dementsprechend muss man trotzdem darüber lesen, korrigieren.

Sonst bleibt dir nur übrig ein Flachbettscanner zu kaufen (oder wie oben beschrieben im AiO Scanner legen) und jede Seite Einzeln zu scannen, damit erreichst du die höchste mögliche Qualität, bei der OCR-Erkennung über Acrobat.
 
Zuletzt bearbeitet:
Zurück
Oben