Bild wird in Omnipage als Text erkannt

Mr. Brooks

Lt. Commander
Registriert
Aug. 2011
Beiträge
1.441
Hallo,

als Alternative zu tesseract-ocr für die Texterkennung habe ich mir auch mal Omnipage angesehen. Bei einem Dokument mit Text und Bildern wird ein Bild (eine Landkarte die Text enthält) komplett als Text erkannt. Ich sehe in Omnipage keine Möglichkeit dem Programm zu sagen er soll dieses Bild als ganz normales Bild verarbeiten. Hab ich da was übersehen? Es ist egal welche Erkennungs-Methode (Automatisch, Tabelle, Formular) ich verwenden.

Mr. Brooks
 
Naja, ich verstehe die Frage jetzt nicht. Du nutzt eine Texterkennungssoftware und bemängelst, dass diese Text erkennt...

Wenn dich das stört scanne die Seiten halt einzeln ein und entsprechend halt als Bild, wenn es sich um Bilder handelt.
 
Nein. Das Buch besteht aus Text und Bild. Normal werden Bilder als solche erkannt und es wird keine Texterkennung gemacht. Das Bild wird normal eingebunden. Im vorliegenden Fall enthält das Bild aber selber Text weshalb man hier versucht den Text zu erkennen. Das Bild wird dabei zerschossen. Einzeln scannen geht nicht, da das Bild nur die Hälfte der Seite ausmacht, der Rest ist Text.
 
Zurück
Oben