Text aus PDF inkl. Felder kopieren

DH187

Cadet 4th Year
Registriert
Sep. 2019
Beiträge
115
Ich habe mit Acrobat 2020 eine PDF mit Feldern erzeugt, die ich aus einem anderen Programm fülle.
Das funktioniert so weit.

Wenn ich den Inhalt des Dokumentes aber kopieren möchte, so wird per STRG-A nicht der Inhalt der Felder markiert (und somit auch nicht kopiert). Wenn ich ein einzelnes Textfeld anwähle, dann wird per STRG-A nur der Inhalt des Feldes markiert.

Wie kann ich den gesamten Text (inkl. Inhalt der Felder) markieren und kopieren?
Die einzelnen Elemente haben die korrekte Lese-Reihenfolge.

Ich habe bislang noch nie PDFs mit Feldern erzeugt. Es ist mein erster Versuch und ich weiß nicht, wo ich ansetzen muss. Ist es ein allgemeines Problem ist oder handelt es sich um eine Einstellung in Acrobat, die gesetzt werden muss.
 
Wenn du mit dem Cursor einfach alles martkierst und dann per Strg+C kopierst geht es?

EDIT: Gerade selber getestet. In beiden Fällen geht es nicht, was bei Adobe normal zu sein scheint. Auch mit dem Lesemodus geht es leider nicht.

Wenn du das nicht oft machen musst wäre vielleicht als PDF drucken (kein Formular mehr) und dann kopieren eine Lösung.
 
Zuletzt bearbeitet:
Versuche mal das PDF als Word abzuspeichern und dann zu kopieren bzw. danach wieder in ein PDF umzuwandeln (sofern ich Dein Problem richtig verstehe).
 
Danke für die schnellen Antworten, aber das funktioniert leider nicht.

Der Weg über Word geht nicht wirklich, da dann die Lesereihenfolge kaputt geht.

In meinem Beispiel:

Struktur in Acrobat:
Textzeile_1
Feld_1 Textzeile_2
Feld_2 Textzeile_3

Lesereihenfolge: TZ1 F1 TZ2 F2 TZ3

Nach dem Exportieren nach Word (aus Acrobat 2020) habe ich aber eine Struktur in dieser Reihenfolge
TZ1
F1
F2
TZ2 TZ3

Ich kann zwar die einzelnen Text-Bausteine lesen, aber der Text ist durcheinander gewürfelt.

Außerdem ist es das Ziel, dass ich eine saubere PDF habe und jeder mit einem x-beliebigen Reader, beim Kopieren alle Text-Daten kopieren kann.

Interessanterweise erzeugt Finereader 14 eine korrekte Word-Datei, wenn es um die Reihenfolge geht!
Dafür werden aber Grafiken (Vektor) zerschossen.
 
Vielleicht erklärst Du nochmal genau deinen workflow und was Du damit beabsichtigst und welche Programme genutzt werden. Mir ist das nach deiner letzten Antwort nicht wirklich klar ;)
 
Ich erzeuge ein PDF mit Text & Feldern (und Grafiken, aber das ist für das Problem nebensächlich).
Die Felder werden mit einem externen Tool automatisch gefüllt und danach abgespeichert.

Ich versuche ein nahezu perfektes PDF zu erzeugen (beim ersten mal nimmt man sich einfach mehr Zeit)
Und da habe ich das Problem, dass ich beim "Auslesen" des Inhaltes der PDF per STRG-A/STRG-C den Text aus den Feldern nicht markiert bekomme.

Also wenn in der PDF

Ich habe
3 Äpfel
5 Birnen


steht, wobei die fetten Texte Felder sind, dann kopiere ich nur

Ich habe
Äpfel
Birnen


Da ich Laie bin, war meine Frage, wie ich die PDF bzw. deren Felder möglicherweise kennzeichnen muss, um den gesamten Text oder auch nur Teile davon kopieren zu können. Und dabei muss die Reihenfolge natürlich stimmen.

Vielleicht missverstehe ich den Sinn der Felder. Aber es ist der einfachste und schnellste Weg, PDFs automatisch zu füllen, ohne die PDF aufwendig zu analysieren und anzupassen.
Und ich kann nicht verstehen, wieso sich deren Inhalt sich weigert, sich mit dem Rest des Dokumentes kopieren zu lassen.
 
Aber wieso willst Du den Inhalt des gefüllten PDFs (per Hand) kopieren?
PDF ist vom Sinn her eigentlich ein "Endformat", auch wenn man damit noch viel machen kann.

Vielleicht ein anderes Datei-/Dokumentenformat in Betracht ziehen?
 
Und welches denn?
Es muss Vektografiken, Text und Felder unterstützen, auf allen Rechnern lesbar sein, nicht von Mail-Servern blockiert werden und man muss es automatisiert bearbeiten können. Selbst wenn Du das alles manuell, ohne den letzten Punkt machen willst, dann hast Du schon Grenzen erreicht.

Selbst Word, was nicht jeder auf dem Rechner hat, kann mit SVGs nichts anfangen. (war zumindestens so, als ich das das letzte mal vor knapp 1 Jahr überprüft hatte). Und für OLE-Funktionalität (der einzige Weg, über den ich auf Excel & Co. zugreifen kann), muss Office bzw. dessen Teilprorgamm auf dem Rechner installiert & aktiviert sein.

Was sieht für Dich übrigens professioneller aus?
Du bekommst ein Dokument als txt, pdf oder docx? Oder als Bitmap, bei dem Du beim Skalieren sofort siehst, wie stark es optimiert wurde (durch eine Verlustkompression und/oder durch eine niedrige dpi auf A4 bezogen)?

Meiner Meinung nach gibt es keinen anderen Weg als PDF.

Demon_666 schrieb:
Aber wieso willst Du den Inhalt des gefüllten PDFs (per Hand) kopieren?
Gegenfrage: Wieso will man es denn nicht wollen und verbietet es einfach?
Ich finde mit Hilfe von Google leider keine Antwort auf meine Frage und weiß daher nicht, ob es einfach nicht vorgesehen ist oder ob ich mich nur zu dumm anstelle.
Eine Aussage auf der Webseite von Adobe mit dem Hinweis, dass das nicht möglich ist, würde mir schon helfen. Dann könnte ich aufhören zu suchen. Aber so etwas finde ich leider nicht.

Das bedeutet, dass es keinen anderen interessiert oder es so einfach ist, dass klar ist, was man machen muss, ich es aber immer wieder übersehe oder ich mit den falschen Suchbegriffen eine Antwort suche.
Das zweite scheint aber wohl nicht der Fall zu sein:

cvzone schrieb:
EDIT: Gerade selber getestet. In beiden Fällen geht es nicht, was bei Adobe normal zu sein scheint. Auch mit dem Lesemodus geht es leider nicht.
 
Deshalb ja meine Frage nach dem genauen workflow und Co. . ;)
Wenn Du Informationen hast, die erst einmal weiterverwendet werden sollen, macht es vielleicht Sinn nicht gerade pdf als Dateiformat zu nehmen.
Ansonsten fällt mir auf die Schnelle nur eine Umwandlung von pdf in Text o.ä, ein. Diesen kannst Du dann mit einem script nach den gewünschten Infos parsen. Ggf. müsstest du dann das pdf um entsprechende "Marker" erweitern, damit das parsen reibungslos funktioniert.
Ich denke aber, dass Du einen Weg für Dich finden solltest, die erforderlichen Infos auszulesen, bevor sie im pdf eingetragen sind, je nachdem welche tools, Dateiformate etc. vorhanden bzw. einsetzbar sind.
Quasi ein template, dass mit den Infos gefüllt und dann geparst wird. Das kann dann danach in ein pdf zur Weitergabe umgewandelt werden.

Damit und mit den vorhandenen Infos erschöpfen sich mögliche Lösungswege/-vorschläge meinerseits.
 
Zurück
Oben