Dokumente scannen automatischer Dateiname

pleuel

Cadet 2nd Year
Registriert
Feb. 2023
Beiträge
16
Hallo,
Plan ist.
Dokumente bein scannen Ocr bestimmte Inalte z.B. Datum, ReNr, Absender auslesen daraus Dateinemen erzeugen und in ein bestimmtes Verzeichnis kopieren. Das sowohl im Einzel wie auch Stapelscan. Bei letzteren sollte idealerweise erkannt werden ob die Rechnenung 1 oder mehrere Seiten umfasst. Dafür müssen ggf entsprechende Profile für jeweilige Lieferanten oder Zweck angelegt werden. Das einzige Programm was ich derezit kenne was das einigermaßen beherscht ist Paperstream, das in der Lightversion zB. Ricohscannern beiligt. Die Vollversion ab 500€/Jahr ist allerdings dermaßen übertrieben teuer das ich mich frage woher auf einmal diese Geldgier kommt. Jahrelang haben die Software Snapcan die kostenlos dem Scanner beigelegt.
Man könnte natürlich auch über den Umweg die gescannte Datei zwischenspeichern und dann per Pdf Prozessor umbennen und in das Endverrzeichnis kopieren lassen. Wäre natürlich besser wenn man das wie beschrieben gleich beim scannen erledigen könnte.
Jemand eine Idee dazu?
Paperscan läuft bei mir nicht richtig, Abby Finereader Pdf bietet die Möglichkeit so nicht, die Programm von Horland verstehe ich nicht gibt auch keine Beschreibung dazu.
 
Paperless-ngx kann sowas.
Gute Anleitungen gibt es auf youtube.
 
  • Gefällt mir
Reaktionen: prh, KenshiHH, dewa und eine weitere Person
pleuel schrieb:
Die Vollversion ab 500€/Jahr ist allerdings dermaßen übertrieben teuer das ich mich frage woher auf einmal diese Geldgier kommt.
Hat mit Gier nix zu tun.
Auch die müssen zu sehen wie sie ihre Firma am laufen halten und den Leuten zumindest den Mindestlohn zahlen.

Don_2020 schrieb:
Paperless-ngx kann sowas.
+1 dafür.
 
  • Gefällt mir
Reaktionen: madmax2010, dewa und acidarchangel
pleuel schrieb:
Die Vollversion ab 500€/Jahr ist allerdings dermaßen übertrieben teuer das ich mich frage woher auf einmal diese Geldgier kommt.
Dann schau lieber nicht was solche Software im Professionellen Einsatzbereich kostet, da bist du bei großen Volumen schnell im mittleren 5 stelligen Bereich
 
  • Gefällt mir
Reaktionen: BFF
Danke schaue es mal an.
Aua, Input overload.
Bin mir nicht ganz sicher ob es das ist was ich suche, scheint erst mal ein Dms System zum sein.
Da hier noch Postgres und weitere Programme notwendig sind, wird so eine Installation und einrichtung sicher nicht ohne sein, besonders für nicht Programmierer.
Ob es auch das tut was ich vorhabe habe ich auf Anhieb noch nicht verstsanden
 
Dateinamen nach bestimmten Inhalten zu benennen, ist weiterhin kostenlos möglich. Bei mir macht die CaptureOnTouch V4 Pro Software von meinem Canon Dokumentenscanner. (Beispiel)

Ohne Programmierkenntnisse kannst du des mit Windows Power Automate automatisch verschieben lassen.

Der Code selbst bzw. so ein Script ist aber nicht aufwändig.
Mit AutoHotKey gibt es auch genügend Hilfe von der Community.

Oder per Windows Powershell in etwa so: (muss natürlich angepasst / erweitert werden)

PowerShell:
# Verzeichnisse definieren
$sourceDir = "C:\Users\DeinBenutzername\Desktop\GescannteDateien"
$destinationDir1 = "C:\Users\DeinBenutzername\Desktop\SUCHWORTORDNER"
$destinationDir2 = "C:\Users\DeinBenutzername\Desktop\SUCHWORTORDNER2"

# Suchwörter definieren
$searchWord1 = "SUCHWORT1"
$searchWord2 = "SUCHWORT2"

# Dateien durchsuchen und verschieben
Get-ChildItem -Path $sourceDir | ForEach-Object {
    if ($_.Name -like "*$searchWord1*") {
        $destinationPath = Join-Path -Path $destinationDir1 -ChildPath $_.Name
        Move-Item -Path $_.FullName -Destination $destinationPath
    } elseif ($_.Name -like "*$searchWord2*") {
        $destinationPath = Join-Path -Path $destinationDir2 -ChildPath $_.Name
        Move-Item -Path $_.FullName -Destination $destinationPath
    }
}

Write-Output "Dateien wurden erfolgreich verschoben."
 
Zuletzt bearbeitet von einem Moderator:
Sogar Irfanview kann das, alles als .tiff speichern und dann OCR drüber laufen lassen.
Oder auf auf software umsteigen die beides auf einmal macht.
 
also ich kenne nur die "großen" Platzhirsche in dem Sektor und da ist sowas also ein Dokument automatisch benennen zu lassen gar nicht mal trivial bzw. sehr Fehlerträchtig. Die OCR verließt sich auch mal hier und da je nach Qualität des Scans da kann aus einer 1 auch mal ein l oder i werden. Richtig interessant wirds dann wenn Sonderzeichen ins Spiel kommen / \ : z.B. die sind als Dateinamen nämlich nicht erlaubt, findet man oft in Rechnungs oder Aktennr.

Dann könnte man auch Regelbasiert mit Mustererkennung usw. laufen lassen auch sehr schwierig bis das mal richtig läuft, das ist ein riesen Gebiet.
 
  • Gefällt mir
Reaktionen: ThomasK_7
Besten Dank für den Tip mit Paperless scheint mir ein gutes Dms zu sein. Ob es die Scananforderung löst kann ich noch nicht beurteilen. Die Einrichtung ist wie befürchtet Hardcore! Docker auf dem Nas einrichten? Hilfe!! Per ssh auf das NAs zugreifen und einen Superuser einrichten?? Gruselig! Mein armer Kopf.
Naja hatte irgendwie in Nacht noch Ideen und nach einigen Versuchen habe ich es doch noch hin bekommen.
Was mir an sich gut gefällt das man nun von jeden Pc aus auf das DMs zugreifen kann ohne es nochmal neu installieren zu müssen. Jetzt werde ich mich erstmal durch die Einrichtung quälen und mit Daten füttern und später mal schauen ob und wie ich es schaffe einen Scanner anzubinden.

Ja mit den Problem beim Ocr bin ich auch immer wieder begeistert. Selbst der gleich Lieferant hält entweder die Positionen nicht ein oder die Ausdrucke sind dermaßen schief das der Text auch der der Position fällt. Von unterschiedlichen Versendern fange ich erst gar nicht an, da gibt es nichts was es nicht gibt.
Daran ist aber Entwicklungsland Hurra Deutschland selbst schuld. Für alles gibt es Din Iso nur nicht verbindlich für Rechnungen. Als Hinterhofland sind wir wieder die letzten die nächstes Jahr Zugpferd bzw Xrechnung einführen. Dort liegt dann, so verstehe ich das, so ein xml Layer über Pdf mit festen Positionen für die Rechnungsdaten. Dann sollte das alles einfacher werden.
 
Für gewerbliche Rechnungsempfänger wird sich mit der e-Rechnung in Kürze sehr viel ändern!
Vielleicht ist dann das mit dem OCR-Einscannen dann gar nicht mehr das Topthema.
Für Privat/Kleinstfirma sollte auch das händische Namensgeben kein übergroßer Aufwand sein.
Da jeder Rechnungsersteller seine RN woanders auf den Brief schreibt, ist allein schon die Einrichtung der jeweiligen OCR-Funktion nicht ganz ohne. Das lohnt imho meist den ganzen Aufwand nicht.
 
Zuletzt bearbeitet:
pleuel schrieb:
Die Einrichtung ist wie befürchtet Hardcore! Docker auf dem Nas einrichten? Hilfe!! Per ssh auf das NAs zugreifen und einen Superuser einrichten?? Gruselig! Mein armer Kopf.
Und jetzt überlege dir, warum es Produkte gibt, die dir die Hardcorearbeit abnehmen und halt 500 Euro im Jahr kosten.

Cu
redjack
 
  • Gefällt mir
Reaktionen: sikarr
pleuel schrieb:
Ja mit den Problem beim Ocr bin ich auch immer wieder begeistert. Selbst der gleich Lieferant hält entweder die Positionen nicht ein oder die Ausdrucke sind dermaßen schief das der Text auch der der Position fällt. Von unterschiedlichen Versendern fange ich erst gar nicht an, da gibt es nichts was es nicht gibt.
Ich kenne Paperless jetzt nicht, mit der Software mit der ich zu tun hatte gabs mehrere Möglichkeiten solche Sachen zu finden und auch zu korrigieren.

Zum Bsp. eine Schräglagenkorrektur, oder so Sachen wie RechnNr können über eine Mustersuche ala RegEx gefunden werden. Oder man hat feste Zonen oder dynamische Zone die wiederrum an bestimmt Ankerpunkten ausgerichtet werden. damit spielt es keine Rolle ob das Bild mal kleiner ist oder verutscht etc. und alles geht dann auch in Kombination. Mittlerweile kann man solche Software auch durch anzeigen anlernen, man muss also nur auf das Element klicken was man haben will und die Software merkt sich das und wird immer besser je öfter man das macht.

Ka, ob Paperless sowas kann?
 
Zurück
Oben