Automatische Umbenennung von PDF-Dateien anhand des Inhaltes

PeachLi

Newbie
Registriert
Juni 2017
Beiträge
3
Hallo Zusammen,

ich scanne alle Dokumente mit meinem Fujitsu Scanner, der die Dateien grob umbenennt, also das Datum aus dem Dokument ausließt oder die Mehrwertsteuer in den Dateinamen schreibt.

Natürlich sind die Ergebnisse nicht optimal, da die Dokumente teilweise sehr unterschiedlich aufgebaut sind und er auch keine Umlaute erkennt.
Nun habe ich den "Automatic PDF Processor" versucht. Hier muss jedoch ein Textfeld für jede PDF festgelegt werden.
Gibt es ein Alternatives Programm, welches einen ganzen Ordner PDF Dateien umbenennt und ggf. die wichtigsten Kategorien automatisch erkennt?
Alternativ wäre es mir auch liebt, wenn er mir nacheinander alle Files anzeigt, um mich zu fragen, welches Objekt bzw. Text er verwenden soll, so dass man den Ordner schnell abarbeiten kann.

Danke schon einmal!
 
PeachLi schrieb:
Gibt es ein Alternatives Programm, welches einen ganzen Ordner PDF Dateien umbenennt und ggf. die wichtigsten Kategorien automatisch erkennt?
Da kein Programm hellsehen kann was du brauchst oder gerade eben jetzt gebraucht wird - nein.

PeachLi schrieb:
Alternativ wäre es mir auch liebt, wenn er mir nacheinander alle Files anzeigt, um mich zu fragen, welches Objekt bzw. Text er verwenden soll, so dass man den Ordner schnell abarbeiten kann.
Auch das kann nicht wirklich klappen.
Dazu braucht es die Vorschau der PDF (oder m.M.n. ›des Scans‹) in ausreichender Größe um ggf. sogar direkt daraus Daten zu kopieren um dann den Dateinamen zu ändern.


Persönlich… …traue ich OCR so lange ich damit umgehe nicht! Dann noch Dateinamen daraus zu basteln - ich müsste alle diese Namen gegen den Inhalt manuell abgleichen um Unfälle aufzufangen.
Das hieße ich betrachte das Quelldokument, scanne es zu PDF und gebe jede mal - und hier verzweifle ich an aller Scannersoftware! - manuell den Namen ein den meine Augen dem Dokument entnehmen. Automatische Einzüge müssten mich wenn jedes mal fragen, mit dem Scan auf dem Schirm, wie das Kind denn heißen soll und dann das nächste Blatt verarbeiten.

Was tun? Sortieren nach Typ (auf gescheite Namensvorschläge von OCR hoffe ich, wie gesagt, niemals) und en bloc scannen, mit einer SW splitten und dann wie oben manuelle diese Gruppe abarbeiten oder auf OCR hoffen, dass jedes Päckchen brauchbare Namen bekommt.

CN8
 
  • Gefällt mir
Reaktionen: PeachLi
Leider gibt es außerhalb von Zugpferd keinerlei Regel für Gestaltung/Inhalte der Pdf Dateien. So gibt es nichts was es nicht gibt, zB eine scheinbar einfach Sache wie das Datum, abgesehen wo es genau steht oben unten r l. YYYY-MM-DD / DD-MM-YYYY / DD-Monat_YYYY / DD-MM-YY usw usw. Insofern kenne ich ausser APP nicht vergleichbares. Leider muß man aber recht viele Profile, je Versender, anlegen damit das was man haben möchte auch zuverlässig erkannt wird. Mit Regex kann man die Erkennung teilweise auch noch verbessern. Da kommt man aber wie ich finde als Nichtprogrammierer an seine Grenzen. Allerdings wenn man diese Hürden genommen hat kann man sich entspannt zurücklehnen. Die Daten werden automatisch so umbenannt wie man es braucht und stehen im vorgebenen Ordner. Die andere Möglichkeit ist Online, es gibt Anbieter die haben vermutlich eine trainierte Ki mit der die meisten Möglichkeiten erkannt werden. Kostet aber pro Pdf.
 
Zurück
Oben