Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Paperless ngx archiviert Kontoauszug nicht
- Ersteller grieche47
- Erstellt am
Also nicht das wir uns falsch verstehen. In paperless wird die Datei gespeichert, ist durchsuchbar usw.
Ist in der paperless Datenbank aufgenommen.
Deswegen wird auch gerade auf github so getan, als ob doch alles gut ist solange das File in paperless ist.
Mit geht das darum, wenn ich jetzt aus dieser Datei zb "Handbuch Laptop" mache und paperless es mir dann ordentlich,nach meinem schema, in meiner Ordnerstruktur hinterlegt.
Filename zb JAHR_TAG_KORRESPONDENT_NAME
Ich möchte die Dokumente ja auch außerhalb von paperless sauber strukturiert vorliegen haben.
Ist in der paperless Datenbank aufgenommen.
Deswegen wird auch gerade auf github so getan, als ob doch alles gut ist solange das File in paperless ist.
Mit geht das darum, wenn ich jetzt aus dieser Datei zb "Handbuch Laptop" mache und paperless es mir dann ordentlich,nach meinem schema, in meiner Ordnerstruktur hinterlegt.
Filename zb JAHR_TAG_KORRESPONDENT_NAME
Ich möchte die Dokumente ja auch außerhalb von paperless sauber strukturiert vorliegen haben.
Ja genau, das ist eigentlich nur mein Problem.
Es wurde doch anfangs erwähnt, das im Ordner orginals nur die org Dateien sind, ohne ocr.
Siehe Beitrag von @h3@d1355_h0r53
Es wurde doch anfangs erwähnt, das im Ordner orginals nur die org Dateien sind, ohne ocr.
Siehe Beitrag von @h3@d1355_h0r53
Zuletzt bearbeitet:
Wenn ich deinen Post so lese ist mein "Problem" wohl gar kein "Problem" 😁M-X schrieb:Also bei mir lnadet die Datei umbenannt in "Bedienungsanleitung" im order "originals" in der Struktur wie ich das definiert habe. Ist dein Problem nur das es nicht auch im "archive" order zu finden ist ?
Wenn ich das richtig verstehe.
Packe ich eine durchsuchbare Datei in PL dann hätte ich alles was PL bietet im "orginals" Ordner. Es wird das Dokument in die entsprechenden unterordner gepackt und umbenannt nach dem definierten schema.
Anders verhält es sich bei einem scan bzw bei einem nicht durchsuchbaren file. Dieses wird erst im archive zum durchsuchbaren File da im originals Ordner der reine scan bzw die nicht durchsuchbare Datei ist?
So Richtig?
Evil E-Lex
Commander
- Registriert
- Apr. 2013
- Beiträge
- 2.883
Das Ganze ist kein Problem von Paperless. ocrmypdf scheitert ebenfalls:
Die Datei erlaubt es schlicht nicht, den Text zu kopieren. Die Verschlüsselung dient hier dazu, bestimmte Aktionen mit der Datei nicht zu erlauben:
Allerdings ist diese Handbuchdatei ein denkbar schlechtes Beispiel, da sie bereits durchsuchbaren Text enthält und OCR daher überhaupt nicht nötig ist.
Code:
ocrmypdf Downloads/c200dcd7ca4d36adb6a9a2528668f7ced400.pdf output.pdf
EncryptedPdfError: Input PDF is encrypted. The encryption must be removed to _common.py:261
perform OCR.
Die Datei erlaubt es schlicht nicht, den Text zu kopieren. Die Verschlüsselung dient hier dazu, bestimmte Aktionen mit der Datei nicht zu erlauben:
Code:
❯ qpdf --show-encryption Downloads/c200dcd7ca4d36adb6a9a2528668f7ced400.pdf
R = 3
P = -1340
User password =
Supplied password is user password
extract for accessibility: allowed
extract for any purpose: not allowed
print low resolution: allowed
print high resolution: allowed
modify document assembly: not allowed
modify forms: not allowed
modify annotations: not allowed
modify other: not allowed
modify anything: not allowed
Allerdings ist diese Handbuchdatei ein denkbar schlechtes Beispiel, da sie bereits durchsuchbaren Text enthält und OCR daher überhaupt nicht nötig ist.
Hallo zusammen,
ich bin gerade noch in der Testphase mit paperless-ngx und mir ist beim testweise kopieren einiger PDFs in den consume-Ordner auch dieses Verhalten aufgefallen. 1 von 4 PDFs wurde zwar prozessiert und landete anschließend im originals Ordner, jedoch (mit derselben Fehlermeldung) NICHT im archive-Ordner.
Falls dieses Verhalten (ist es nun ein Bug oder nicht?) nicht behoben werden kann, müsste ich für mich einen Workaround basteln, der z.B. die beiden Ordner überwacht, die Inhalte vergleicht und im Fall, dass eine Datei zwar im originals- aber nicht im archive-Ordner existiert, diese dorthin kopiert (auch wenn sie dann nicht ocr-isiert ist).
Was denkt Ihr?
Vielen Dank und viele Grüße,
Jochen
ich bin gerade noch in der Testphase mit paperless-ngx und mir ist beim testweise kopieren einiger PDFs in den consume-Ordner auch dieses Verhalten aufgefallen. 1 von 4 PDFs wurde zwar prozessiert und landete anschließend im originals Ordner, jedoch (mit derselben Fehlermeldung) NICHT im archive-Ordner.
Ja schon, aber: ich möchte die von paperless-ngx prozessierten Dokumente aus dem archive-Ordner parallel via Cloud auf meinen PC syncen und dort in meine vorhandene Ordnerstruktur (halbautomatisch) einsortieren lassen. Daher genügt es mir nicht, die Datei nur im originals zu haben, ich brauche sie auch in archive.M-X schrieb:Mir ist nicht ganz klar wann files im "archive" und wann im "originals" landen. Kurzer Blick auf die Doku hat es mir auch nicht 100% erläutert. Wenn du aber beide Ordner im zugriff hast kommst du auf 100% der Dokumente.
Falls dieses Verhalten (ist es nun ein Bug oder nicht?) nicht behoben werden kann, müsste ich für mich einen Workaround basteln, der z.B. die beiden Ordner überwacht, die Inhalte vergleicht und im Fall, dass eine Datei zwar im originals- aber nicht im archive-Ordner existiert, diese dorthin kopiert (auch wenn sie dann nicht ocr-isiert ist).
Was denkt Ihr?
Vielen Dank und viele Grüße,
Jochen
Also: so weit ich das verstanden habe, werden die Originale unangetastet im originals-Ordner gespeichert, die prozessierten, d.h. u.a. OCRisierten Dateien dann im Ordner archive. Das hier angesprochene Problem ist, dass signierte PDFs nicht prozessiert werden können, da die Signatur sonst verständlicherweise ja nicht mehr gültig wäre. Es wurde ja aber mehrfach beschrieben, wie man sie trotzdem in originals abspeichern kann, nur tauchen sie dann eben nicht in archive auf. So weit, so gut.
Mein Problem war ja aber, dass ich zusätzlich zur Datenhaltung in paperless-ngx alle prozessierten Dateien (die in archive) via meinem Cloud-Server auf mein Laptop kopieren und dort (halbautomatisch) per FileJuggler in meine gewohnte Ordnerhierarchie packen möchte. Dazu benötige ich auch die signierten Dateien in archive.
Dies habe ich nun mit Incron und einem selbstgeschriebenen Script gelöst:
iIncron auf dem paperless-ngx-Server installiert. Incron überwacht einen anzugebenden Ordner (hier originals) auf neu hinzugekommene Dateien. Wenn eine neue Datei hinzukommt, startet es ein Script, welches erstmal eine gewisse Zeit wartet (falls die Datei tatsächlich prozessiert werden könnte), dann prüft, ob die Datei auch in archive vorhanden ist und falls nicht, sie dorthin kopiert. Auch wenn sie nicht OCRisiert wurde.
Die incrontab dazu sieht folgendermaßen aus:
Und das Script copy_if_not_exists.sh:
Von dort werden dann alle Dateien ebenfalls per incron einmalig (!) in den Sync-Ordner kopiert, um dann via Cloud auf meinen Laptop gesynct zu werden. "Einmalig", da die Datei, wenn sie nach dem Einsortieren via FileJuggler aus dem Sync.Ordner verschwindet, nicht jedesmal neu wieder dort erzeugt wird.
Diese incrontab sieht so aus:
Vielleicht hilft das ja dem ein oder anderen.
Viel Erfolg und viele Grüße,
Jochen
Mein Problem war ja aber, dass ich zusätzlich zur Datenhaltung in paperless-ngx alle prozessierten Dateien (die in archive) via meinem Cloud-Server auf mein Laptop kopieren und dort (halbautomatisch) per FileJuggler in meine gewohnte Ordnerhierarchie packen möchte. Dazu benötige ich auch die signierten Dateien in archive.
Dies habe ich nun mit Incron und einem selbstgeschriebenen Script gelöst:
iIncron auf dem paperless-ngx-Server installiert. Incron überwacht einen anzugebenden Ordner (hier originals) auf neu hinzugekommene Dateien. Wenn eine neue Datei hinzukommt, startet es ein Script, welches erstmal eine gewisse Zeit wartet (falls die Datei tatsächlich prozessiert werden könnte), dann prüft, ob die Datei auch in archive vorhanden ist und falls nicht, sie dorthin kopiert. Auch wenn sie nicht OCRisiert wurde.
Die incrontab dazu sieht folgendermaßen aus:
/home/paperless/paperless-ngx/media/documents/originals/ IN_CREATE /home/paperless/copy_if_not_exists.sh $#
Und das Script copy_if_not_exists.sh:
#!/bin/bash
# 40 Sekunden warten
sleep 40
# Verzeichnisse
dir_a="/home/paperless/paperless-ngx/media/documents/originals"
dir_b="/home/paperless/paperless-ngx/media/documents/archive"
file_name="$1"
# Pfad zur Datei in Verzeichnis a
file_a="$dir_a/$file_name"
# Pfad zur Datei in Verzeichnis b
file_b="$dir_b/$file_name"
# Überprüfen, ob die Datei bereits in Verzeichnis b existiert
if [ -f "$file_b" ]; then
echo "Die Datei '$file_name' existiert bereits in Verzeichnis '$dir_b'."
else
# Datei nach Verzeichnis b kopieren
cp "$file_a" "$dir_b"
if [ $? -eq 0 ]; then
echo "Die Datei '$file_name' wurde erfolgreich nach '$dir_b' kopiert."
else
echo "Fehler beim Kopieren der Datei '$file_name' nach '$dir_b'."
fi
fi
Von dort werden dann alle Dateien ebenfalls per incron einmalig (!) in den Sync-Ordner kopiert, um dann via Cloud auf meinen Laptop gesynct zu werden. "Einmalig", da die Datei, wenn sie nach dem Einsortieren via FileJuggler aus dem Sync.Ordner verschwindet, nicht jedesmal neu wieder dort erzeugt wird.
Diese incrontab sieht so aus:
/home/paperless/paperless-ngx/media/documents/archive/ IN_CREATE /usr/bin/cp -pR $@$# /home/paperless/paperless2seafile
Vielleicht hilft das ja dem ein oder anderen.
Viel Erfolg und viele Grüße,
Jochen
Zuletzt bearbeitet:
Ähnliche Themen
- Antworten
- 2
- Aufrufe
- 507
- Antworten
- 15
- Aufrufe
- 901
- Antworten
- 15
- Aufrufe
- 3.281
- Antworten
- 8
- Aufrufe
- 1.057