Text kopieren aus geschützter .pdf Datei

KetzZza

Lt. Commander
Registriert
Juni 2007
Beiträge
1.043
hallo,


ist es irgendwie möglich, den Inhalt (nur Text) einer geschützten .pdf Datei zu kopieren und in ein Word Dokument einzufügen?


Danke schonmal!:)
 
Und dann ne Texterkennung über das abgespeicherte Bild laufen lassen.
 
hast du nur den Adobe Reader oder auch eine Acrobat Professional Version? Mit Professional kann man auf jeden Fall den Text markieren. Kopieren sollte also nicht das Problem sein.
 
du kannst es aber auch mal mit dem pdf xChange viewer probieren gibts gratis einfach mal danach suchen
 
pgAction schrieb:
Mit Professional kann man auf jeden Fall den Text markieren. Kopieren sollte also nicht das Problem sein.
Falsch. Es ist beim Erstellen der Datei durchaus möglich, auch das zu unterbinden. Bleiben also nur OCR-Programme, die meist auch *.pdf direkt öffnen und entsprechend erkennen können.
 
cpt. Nemo schrieb:
Falsch. Es ist beim Erstellen der Datei durchaus möglich, auch das zu unterbinden. Bleiben also nur OCR-Programme, die meist auch *.pdf direkt öffnen und entsprechend erkennen können.

Das mag schon sein. Kommt in jedem Fall darauf an, wie stark die PDF geschützt ist.
 
Mit Ghostview öffnen, dann Edit -> Text Extract. Seite(n) auswählen und als .txt speichern.
Ergänzung ()

markus2 schrieb:
Nimm den (bereits erwähnten) PDF-XChange Viewer
http://www.portablefreeware.com/index.php?id=1436
Der ist portabel und den juckt es nicht, ob das PDF File geschützt ist oder nicht.

Juckt ihn doch. Ich habe es eben mit einer geschützen pdf-Datei ausprobiert, kopieren nicht möglich!
 
Zuletzt bearbeitet:
Sofern man Word installiert hat, nutze ich meist den Microsoft XPS Document Writer. Der lässt sich als Drucker asuwählen (über "Drucken"). Der speichert das ganze dann als Datei ab, die sich kopieren lässt.
 
Mit PDF-XChange Viewer habe ich gute Ergebnisse erzielen können, es gibt auch ein Freeware. Ab und zumal werden Textabsätze nicht richtig gelesen, am besten ist es immer, wenn du das dann überprüfst.
 
@garbel, und mit Ghostview soll das funktionieren? Kann ich nicht glauben, genauso wenig wie mit dem XPS Document Writer.
Wenn die Entnahme beim Erstellen von PDF Dokumente mit Adobe gesperrt ist, gibt es m. E. keine Möglichkeit den Text direkt zu kopieren. Das Dokument als Bitmap speichern und dann mit einem OCR Programm neu einzulesen sollte die einzige Möglichkeit sein.
 
Zuletzt bearbeitet:
Ja, ich hab es eben mit den Simyo-Geschäftsbedingungen ausprobiert ;) (siehe unten)

Mit dem XPS-Document Writer geht es auch nicht.

Hier auch mein erfolgloser Versuch mit dem XChange Dingsbums (siehe auch unten)

Ich weiß nicht, inwieweit man pdfs noch stärker schützen kann, das Extrahieren als Text funktioniert zumindest für dieses pdf mit ghostview.
 

Anhänge

  • simyotest.png
    simyotest.png
    72,2 KB · Aufrufe: 4.300
  • simyogs.png
    simyogs.png
    38,8 KB · Aufrufe: 3.524
Zuletzt bearbeitet:
Die Geschäftsbedingungen, die ich gerade von Simyo geladen habe, haben eh keinen Schutz. Somit hat kein PDF Reader Probleme damit. Probiere doch einmal eine geschützte Datei, die mit einem Passwort versehen ist.
 
el cínico schrieb:
Die Geschäftsbedingungen, die ich gerade von Simyo geladen habe, haben eh keinen Schutz. Somit hat kein PDF Reader Probleme damit. Probiere doch einmal eine geschützte Datei, die mit einem Passwort versehen ist.

Meine schon. Guckstdu ersten Screenshot, da steht oben (GESICHERT). Ich hab's doch eben alles ausprobiert, nur mit ghostview klappt es.
 
Keine Ahnung was die Programme anzeigen. Acrobat zeigt von der frisch geladenen PDF folgendes an. Warum sollten AGB auch verschlüsselt sein?


edit: Ich sehe, du hast eine ältere Version der AGB.
 

Anhänge

  • Aufzeichnen.PNG
    Aufzeichnen.PNG
    125,4 KB · Aufrufe: 1.558
Zuletzt bearbeitet:
druck die datei einfach als PDF dann gehts auch ^^ mit dem Kopiern und der Schreibschutz is gleichzeitig weg
 
el cínico schrieb:
Die Geschäftsbedingungen, die ich gerade von Simyo geladen habe, haben eh keinen Schutz. Somit hat kein PDF Reader Probleme damit. Probiere doch einmal eine geschützte Datei, die mit einem Passwort versehen ist.

el cínico schrieb:
Keine Ahnung was die Programme anzeigen. Acrobat zeigt von der frisch geladenen PDF folgendes an. Warum sollten AGB auch verschlüsselt sein?

Simyo schützt die pdfs nicht mehr (eben, warum auch...). Meine ältere Version war noch verriegelt und verrammelt (siehe Screenshot). Wenn man zeigen will, wie man einen Schutz überwindet, muß man schon eine geschützte Datei nehmen ;) Ist doch latte, ob die nun von simyo oder xyz kommt.
 

Anhänge

  • 2010-05-20_013103.png
    2010-05-20_013103.png
    16,5 KB · Aufrufe: 1.182
Zuletzt bearbeitet:
@Franny2k: Dann wird der Text in eine Bitmap konvertiert.




Man kann ein PDF Dokument verschlüsseln / sichern, die Entnahme von Text jedoch zulassen.
 
Zurück
Oben