Große pdf Dateien für iPad aufbereiten mittels Abbyy Finereader

PhilU

Cadet 3rd Year
Registriert
Sep. 2010
Beiträge
46
Hallo Gemeinde,

ich habe folgendes Problem. Ich habe einige Lehrbücher mit jeweils um die 500 Seiten im pdf-Format. Blöderweise wurde beim einscannen kein OCR durchgeführt. Die Seiten liegen also als Bilddateien vor.

Ich habe allerdings Abbyy Finereader mit dem ich eine OCR-Erkennung durchführen kann. Das klappt eigentlich sehr gut. Aber eben nur eigentlich.

Bei der Speicherung im pdf-format kann ich wählen ob ich den Text hinter dem Bild machen möchte, sprich ich kann markieren und im Dokument suchen, der eigentliche Text oder Bild ist aber nachwievor eine Bilddatei. Das führt dazu, dass ich auf dem iPad bzw. auch auf dem PC eine unscharfe Darstellung der Schrift habe.
Ich kann allerdings auch den "Text vor dem Bild" als Speicheroption auswählen. Dies führt dazu, dass der erkannte Text auch als richtiger Text (ich nehme mal an das ist dann ein Vectorformat?) ausgegeben wird, sodass man eine scharfe Darstellung in jeder Zoomstufe hat.
Problem hierbei ist allerdings, dass er in den wirklichen Bildern bzw. Skizzen, die in dem Dokument vorhanden sind, teilweise Text erkennt und dann das Bild/die Skizze so verhaut, dass man sie nicht mehr erkennen kann.

Am liebsten wäre mir also eine Kombination aus beidem, sprich bei Text als solcher den Text im Vectorformat, bei Bildern/Skizzen einfach nichts machen und es als Bild lassen.

Ich hoffe, es gibt genau so eine Option. Denn Bilder von Text zu unterscheiden, das kann Abbyy sehr gut, seh ich ja in der Vorschau, allerdings wenn er dann Text im Bild erkennt, ist es für Abbyy natürlich Text. Dieses Verhalten möchte ich abstellen. Wenn er ein Bild erkennt soll er in diesem Bereich kein Text mehr erkennen.

Natürlich kann ich genau dieses Verhalten manuell beeinflussen, indem ich sage, dass dies nur ein Bild ist und er den Text auslassen soll. Aber bei Dokumentengrößen von über 500Seiten ist das sicherlich keine Option mehr.


Nun geht es natürlich aber noch weiter. Habe ich also die Erkennung von Text und Bild richtig, wie soll ich das ganze für das iPad optimieren? Als pdf lassen, oder als epub exportieren? Nutzt man dann am besten iBooks oder ein anderes Programm (ich kenne nur iBooks). Denn bei dieser Dokumentengröße reagiert das iPad doch teilweise träge.

Ich hoffe hier gibt es jemanden der sich mit der Problematik bei OCR auskennt.

Liebe Grüße,
Phil
 
EDIT: bin gerade draufgekommen, dass es auch ohne Jailbreak geht - siehe iFiles - ich kenne es zwar nicht, da ich iFile aus Cydia verwende aber ich denke es sollte ähnlich sein.
 
Zuletzt bearbeitet:
Wie hilft mir iFile(s) bei meinem Problem? Ist/sind doch nur Fileviewer :(
 
mit denen kannst du die PDF datei ohne ein Problem anschauen - bis man endlich mal eine PDF Datei oder allgemein eine Datei auf einem iPad oder in meinem Fall iPhone hat vergehen ewigkeiten - da ist ein Fileviewer viel besser

ich öffne zB. auf meinem 3GS mit iOS 5 eine 200 Seiten PDF ohne ein muxer - das einzige Problem das ich mit iFile habe, ist, dass ich nicht schnell scrollen kann.
 
Ah, ok, verstehe. Es ist einfach viel schneller beim Betrachten. Das werde ich dann mal testen. Jailbreak ist übrigens kein Problem für mich, werde also iFile sowie iFiles mal testen.

Dafür muss ich dann aber erstmal die Datei fertig haben, womit wir wieder bei ersterem Problemchen sind :)
 
Zurück
Oben