PDFelement 6 Pro OCR identifiziert auch grafische Elemente als Text und verändert diese!

LtComData

Newbie
Registriert
Aug. 2018
Beiträge
6
Guten Tag liebe Community,

ich habe mich hier angemeldet, da ich, zugegeben, etwas benötige.
Ein wenig Hilfe! :-)

Ich verwende das Programm PDFelement 6 Pro, welches mit OCR ausgestattet ist.

Wenn Ich nun ein Dokument bearbeiten möchet, ein PDF also, muss das Programm
den darin enthaltenen Text identifizieren.

Das ist zunächst einmal nicht schwierig.
Was jedoch enorme Probleme bereitet, ist die Tatsache, dass nicht nur der Text
als Text identifiziert wird, sondern auch die grafischen Elemente des Dokumentes.

Ich habe nun noch keinen Weg gefunden, die Texterkennung lediglich auf vorher
markierte Beriche innerhalb einer Seite anzuwenden, um das oben beschriebene
Problem zu umgehen.

Kann mir bitte, bitte, bitte jemand helfen und mir erklären wie das geht?

Leider antwortet der Support, der nur per E-Mail zu kontaktieren ist, auch nicht.
Ich habe es bereits mehr als einmal versucht.


Ich danke euch von Herzen!
 
Hallo @LtComData
leider kann ich dir bei der Lösung deines Problems nicht helfen, aber ich könnte mir vorstellen, dass es ähnlich funktioniert wie damals beim Xerox-Bug.
Hier war das Problem, dass aus Speicherplatzgründen ähnliche Elemente im gescannten Dokument durch andere Varianten ersetzt wurden und nur einmal tatsächlich gespeichert wurden.
 
Hallo, danke für dein Feedback. Allerdings ist es das wohl eher nicht.
Es geht tatsächlich nur darum, dass ausschließlich ein von mir vohrer markierter Bereich
der Seite mit OCR bearbeitet wird und nicht einfach die die komplette Seite.
 
schieb,

vielleicht kann man ja das Dokument drucken, und es scannen,
gibt es denn ein Tool, das ich verwenden kann um beim eigentlichen Scannvorgang
zu markieren was text ist und was nicht?
 
Was ist, «woher stammt», die Quelle die du dem (mir zugegeben unbekannten) Tool andingen willst.
Direkt vom Scanner muss zwangsweise die OCR-Instanz deines Tools anbieten zu definieren was einer Seite man erkennen will.
Der konträre Ansatz wäre eine Arbeitskopie = Bild so zu frisieren, dass da nichts ist was zu erkennen wäre. Der Aufwand scheint mir ähnlich.

CN8
 
Zurück
Oben