[S] Programm um aus PDF zukopieren/konvertieren

Basdi

Cadet 3rd Year
Registriert
Apr. 2010
Beiträge
44
Hallo,



ich hab ein nicht soleichtes Problem zubewältigen.

Also ich habe über 130 Seiten Text und Bilder die ich übersetzten muss.
Die Bilder muss ich natürlich aus der PDF rausnehmen und in Word einfügen.

ist klar, gibt diverse Möglichkeiten über Screenshot, Snagit, oder die eingebauten tools bei acrobat reader.

Allerdings würde ich gerne, das die pdf komplett in word umgewandelt wird.
Problem dabei, die PDF um die es sich handelt wurde selbst eingescannt, und alles ist ein großes bild.

Gibt es Programme, können auch was kosten, die das erkennt und text / bild konvertieren kann?
 
Da wäre wohl der ABBYY FineReader das beste, oder wenns etwas billiger sein soll, der PDF Transformer (hat aber weniger Funktionen, aber wenns eh nur um PDFs geht sollte das reichen)
Noch spezieller (und günstiger) wäre ScanTo Office, aber ich weiß nicht ob das mit PDFs umgehen kann, da müsstest du evtl alles neu einscannen.
 
Zuletzt bearbeitet:
Es gibt tatsächlich nur ein Programm, dass recht gute Resultate liefert und nein es ist nicht der Acrobat in der neusten Pro Variante (schlecht bis grausam).
Das Resultat wird aber nur in docx vernünftig, also ab Office 2007.
Kompatibilitätspack bringt nur extra Formatfehler.
Nuance PDF Professional 6

Ich habe lange gebraucht , um dies herauszufinden. Ein kürzlicher Test, dessen Link ich atm nicht finde, hat dies auch bestätigt.

Hab übrigends dasselbe Problem und soll ein Manual ins Deutsche bringen. Trotzdem eine irre Arbeit, da man selbst bei perfekter Formatierung durch Nuance Probleme bei der deutschen Textlänge bekommt.

@ Grantig: Bitte nicht posten, wenn Du es selbst nicht probiert hast. Nicht böse gemeint, aber die sind echt sch... . Ich habe im Windows und Linuxbereich (gibt da eh nicht viel her, nur grausamste Dinge wie pdfedit) alles durch.
 
Zuletzt bearbeitet:
Also der FineReader hat bei mir bis jetzt immer gut funktioniert, hab aber nicht die 10er sondern nur die 9er ausprobieren können. (Bei mir gings aber auch nur um reinen Text, ohne Bilder)
Ich bin einfach mal davon ausgegangen, dass die neue Version nicht schlechter ist als die alte.
 
@Scout X
Nuance PDF Professional 6
habe ich auch nach langem suchen gefunden...
leider hänge ich schon seit 2 minuten bei nuance in der warteschleife :D obwohl ich das produkt kaufen werde...wollte nur kurz rückfrage halten mit dennen.
Und eingescannte seiten kann der also entzifférn?
 
Solange das PDF sehr sauber ist, ja. Aber nichts ist perfekt in dem Bereich.
Auch dieses Programm hat seine Schwächen, kann möglicherweise sogar da scheitern, wo Abby zumindest die bessere Texterkennung hat.
Nuance ist vor allem stark im Layout. Zwei oder dreispaltige Texte mit Bildern und Tabellen in unterschiedlichen Schriftgrößen ist meist nicht das Problem. Auch die Größenverhältnisse im Gesamtdokument stimmen somit meist. Insbesondere wenn die PDFs also aus nicht "Scan-Quellen" stammen, sehr gut.
Beim reinen OCR ist Abby und Co. überlegen, da hier deutlich mehr Schriftarten und Variationen abgeglichen werden.

Bis heute muss man aber sagen, dass kein OCR nur ansatzweise an die menschliche Fehlerkorrektur herankommt. Oft kann man sich nur wundern, an welchen Textpassagen Fehler entstehen. Dabei ist unser latinisiertes Alphabet so simpel. Asiatische Schriftarten sind praktisch heute undenkbar aufzuarbeiten. Selbst einfaches Arabisch. Geht gar nicht.

Übrigends unbedingt bei Nuance auf Office 2007 Dokument Typ umstellen.
Vor allem Ruhe bewahren, nicht ärgern, wenn mal wieder totaler Murks erscheint.

p.s. Du kannst Nuance auch mit Abby kombinieren. Alles im Optionsmenü machbar. Vor allem auf die zwei Optionen legal und standard achten.
Ergänzung ()

Wikipedia wird es mir nicht verübeln: Ein Beispiel
http://upload.wikimedia.org/wikipedia/commons/3/3a/Einmaleins.pdf
Schwieriges Dokument

Siehe Anhang das Ergebnis

Wie man sieht nicht perfekt aber doch sehr gut. Zum Teil sind die Textboxen etwas zu klein, so dass die Schrift nicht lesbar ist. Da muss man per Hand eben vergrößern.
Einstellung war Office 2007 Format , legal, True Page, mit allem angehakt, was unter legal eingebunden werden kann.
 

Anhänge

Zuletzt bearbeitet:
Zurück
Oben