PDF - Alle Seiten mit rotem Text finden

Hilfe2019

Cadet 4th Year
Registriert
Mai 2019
Beiträge
84
Ich habe hier eine PDF mit ca. 1.500 Seiten. Auf einigen Seiten sind Fehlermeldungen mit rotem Text geschrieben. Leider kann ich nicht nach dem Text suchen, da dieser zu oft vorkommt. Die pdf liegt als Zeichnung vor.

Hat wer eine Idee wie ich hier weiter komme?
 
Moin,
ein paar mehr Infos wären nicht schlecht:
Was willst Du überhaupt machen/erreichen? Ud wie genau: in roter Schrift, mit rotem Kugelschreiber daneben, als Notiz/Anmerkung? Um was für einen Suchtext geht es?
Je konkreter die Ausgangsinfos, umso besser kann man helfen...
 
PDF enthält roten Text. Über OCR habe ich en Text, der nur als Zeichnung vorlag durchsuchbar gemacht.
Es geht um Verweise "Seite:". Ist der Verweis auf eine Seite ungültig wird dieser in rot geschrieben. Ich möchte genau diese Stellen finden. Die Suchfunktion führt nicht zum Ziel, da zuviele Treffer "Seite:" in schwarz - Verweis stimmt..
 
Versuche mal, das PDF (oder erstmal ein paar Seiten als Test) in das Word-Format umzuwandeln. Suche dann nach nicht nach Verweis o.ä. sondern nach "Fehler". Checke auch mal, was mit den Feldfunktionen in word geht. Wenn ich mich recht erinnere, meckert word doch bei nicht funktionierenden Querverweisen. Ansonsten bliebe nur ein (aufwändiges) Word-Makro, Stichpunkt ".References". Mehr fällt mir grad dazu nicht ein.
 
Word Umwandlung bringt da nichts, da ja dabei keine Verweisfelder erstellt werden. Besser wäre, wenn du an das Original rankämst.
Vielleicht gibt es ja noch einen textlichen Unterschied zwischen den richtigen und falschen Seitenverweisen?

Ansonsten hilft wohl nur ein großer Bildschirm, um einigermaßen effizient durch die roten Textstellen zu kommen. Was ist überhaupt das Ziel, also was willst du mit den roten Stellen anfangen?
 
Der Quelltext nütz mir nicht, da der Fehler erst beim Drucken sichtbar wird. 1.200 Seiten durchsuchen wil ich mir ersparen. Es gibt keinen textlichen Unterschied. Nur das Wort "Seite:" wird in rot gedruckt.
 
Hilfe2019 schrieb:
Die pdf liegt als Zeichnung vor
1200 Seiten! Wie kann dann die PDF als Zeichnung vorliegen? Das müssten ja 1200 PDF-Dateien sein?! Oder sind die einzelnen Dateien vereinigt worden?
Hat das OCR-Programm die roten Texte auch als rot erkannt? Das können nicht alle Programme.
In was für einem Format hat das Programm die Seiten gespeichert?
Fragen über Fragen...

Hilfe2019 schrieb:
Der Quelltext nütz mir nicht, da der Fehler erst beim Drucken sichtbar wird.
Wenn der Drucker die Stellen rot druckt, muss im Quelltext auch ein Steuercode vorhanden sein. Also nutzt der Quelltext sehr wohl was.

Die PDF in Word umzuwandeln bringt nichts (wie @halwe schon geschrieben hat). Die roten Texte werden nicht erkannt.
 
Zuletzt bearbeitet:
Na ja, eine pdf-Datei kann durchaus aus 1200 Seiten eingescannter Textgrafik (zzgl. ergänztem OCR-Text) bestehen. Da es aber eine farbige pdf ist, dürfte sie dann aber recht groß sein.
Und die Word-Umwandlung könnte evtl. doch etwas bringen, wenn nämlich die Textfarbe mit erkannt wird (nach der kann in Word gesucht werden). Aber das wäre höchst fragil, schon wegen des rieisgen Word Dokumentes mit zig Formatierungen, was da rauskäme. Für mich keine echte Alternative zum manuellen Durchlesen.
 
Stromlaufpläne. 1.200 Seiten sind da nix. Mit FlexiPDF kann ich zwar nach ROT suchen und durch GRÜN ersetzen. Damit komme ich aber meinem Zeil nicht näher. Roter Text suchen und Text ändern. Dann finde ich ganz schnell die betroffenen Seiten.
 
Stromlaufpläne… Da ist dann wirklich hartes Brot.

Aber mit welchem Programm willst du die PDFs dann angreifen? Suchen, OK; Farbe tauschen, auch OK; aber Texte ändern? Ein Tool das das kann müsste eigentlich en passant nach Frabe[n] suchen können.

CN8
 
Das Wort Seite steht in rot (das ist ein Fehler) und in Schwarz ( alles Ok). Ich brauche zur Fehlerbehebung die Angabe auf welchen Seiten die Eintragung "Seite:" in rot steht.
Flexipdf (Softmaker) kann die roten Stellen finden und in z.B. grün umfärben. Das ist aber nicht das was ich benötige. Umändern kann Felxipdf auch, aber da ändert das Programm alles um, weil ich kein Filter mit der Schriftfarbe setzen kann.
 
Zurück
Oben