Glowazowski
Lt. Junior Grade
- Registriert
- Nov. 2009
- Beiträge
- 444
Hallo liebe Leute,
mir stellt sich folgendes Problem: Ich habe eine PDF-Datei mit insgesamt 91 Doppelseiten eingescanntem Text. Gescannt wurde das ganze mit einer Auflösung von 400dpi, bei einer Seitengröße von 310mm x 230mm. Das ganze hat eine Dateigröße von ca. 28 MByte.
Jetzt hätte ich gerne, dass da eine Texterkennung drüber läuft und den Text unsichtbar hinter dem gescannten Dokument speichert, so dass ich das ganze noch im originalen Layout ausdrucken kann, die PDF-Datei aber auch durchsuchbar ist (bzw. einzelne Passagen auch raus kopiert werden können).
Aus einer c't aus dem Jahr 2008 habe ich noch eine Vollversion des ABBYY FineReade 6.0 Professional rumliegen. Damit konnte ich den Text zwar erkennen lassen, beim abspeichern als PDF-Datei wurde aber das "Bild" des Textes komplett neu gespeichert. Das hat zur Folge, dass ich entweder eine riesig große Datei erhalte (ca. 210 MByte), die lesbar ist und sich auch noch zum Drucken eignet oder eine deutlich kleinere (ca. 13MByte), die dann aber in der Auflösung soweit reduziert ist, dass an ein Ausdrucken nicht mehr zu denken ist. In den beiden neuen Dateien mit erkanntem Text stimmt auch die Seitengröße nicht mehr mit dem Original überein.
Theoretisch müsste es doch irgendwie gehen, dass das originale Schrift-"Bild" der PDF erhalten bleibt und nur der erkannte Text unsichtbar dahinter gelegt wird. Die Dateigröße dürfte sich dabei ja eigentlich kaum vergrößern, da der reine Text im Hintergrund ja kaum Speicherplatz braucht.
Hat jemand eine Idee, wie ich das hinbekomme, idealerweise mit dem FineReader 6.0 oder einem anderen kostenfreien Programm?
Besten Dank für Eure Hilfe
Wazowski
mir stellt sich folgendes Problem: Ich habe eine PDF-Datei mit insgesamt 91 Doppelseiten eingescanntem Text. Gescannt wurde das ganze mit einer Auflösung von 400dpi, bei einer Seitengröße von 310mm x 230mm. Das ganze hat eine Dateigröße von ca. 28 MByte.
Jetzt hätte ich gerne, dass da eine Texterkennung drüber läuft und den Text unsichtbar hinter dem gescannten Dokument speichert, so dass ich das ganze noch im originalen Layout ausdrucken kann, die PDF-Datei aber auch durchsuchbar ist (bzw. einzelne Passagen auch raus kopiert werden können).
Aus einer c't aus dem Jahr 2008 habe ich noch eine Vollversion des ABBYY FineReade 6.0 Professional rumliegen. Damit konnte ich den Text zwar erkennen lassen, beim abspeichern als PDF-Datei wurde aber das "Bild" des Textes komplett neu gespeichert. Das hat zur Folge, dass ich entweder eine riesig große Datei erhalte (ca. 210 MByte), die lesbar ist und sich auch noch zum Drucken eignet oder eine deutlich kleinere (ca. 13MByte), die dann aber in der Auflösung soweit reduziert ist, dass an ein Ausdrucken nicht mehr zu denken ist. In den beiden neuen Dateien mit erkanntem Text stimmt auch die Seitengröße nicht mehr mit dem Original überein.
Theoretisch müsste es doch irgendwie gehen, dass das originale Schrift-"Bild" der PDF erhalten bleibt und nur der erkannte Text unsichtbar dahinter gelegt wird. Die Dateigröße dürfte sich dabei ja eigentlich kaum vergrößern, da der reine Text im Hintergrund ja kaum Speicherplatz braucht.
Hat jemand eine Idee, wie ich das hinbekomme, idealerweise mit dem FineReader 6.0 oder einem anderen kostenfreien Programm?
Besten Dank für Eure Hilfe
Wazowski
Zuletzt bearbeitet:
(Typo)