PDF Metadaten nach Dateiname Umbenennen (Software / Script gesucht)

Sedesc

Newbie
Registriert
Juli 2023
Beiträge
2
Liebe Mitglieder des Forums,

ich stehe gerade auf der Arbeit vor folgendem Problem.

Wir wechseln unser Dokumentensystem. In unserem neuen System sollen alle Arbeitsverträge, die bereits als PDF vorliegen, importiert werden.

Die Arbeitsverträge sind aktuell in SharePoint / Windows als PDF abgelegt und wie folgt benannt Erstelldatum Dokument (also Datum des Arbeitsvertrages, YYYYMMDD), Dokumententyp Vorname Nachname. Also "20230710 Arbeitsvertrag Max Müller".

In den Metadaten steht als Erstelldatum das Datum an dem die Datei an den aktuellen Ablageort kopiert wurde. Dies macht Windows standardmäßig so. In den Metadaten steht als "Änderungsdatum" der Datei das ursprüngliche Scandatum des PDF-Dokumentes, welches einige Zeit nach dem Vertragsdatum liegt.

Leider kann das neue Programm das Erstelldatum des Dokumentes nur aus dem Metadaten einlesen. Dort steht leider nur das Scandatum nicht das Datum des Arbeitsvertrages / des Dokumentes.

Gibt es eine Möglichkeit das Datum des Dokumentes aus dem Dateinamen in die Metadaten der Datei zu schreiben?

Viele Grüße,
Sedesc
 
geht mit exiftool. grob so:

Bash:
#!/bin/bash

# Loop over all .pdf files in the current directory
for filename in *.pdf; do
    # Check if file exists
    if [[ -f "$filename" ]]; then
        # extract the date from the filename
        date_string=$(echo $filename | cut -d' ' -f1)

        # format the date for exiftool
        formatted_date=$(date -d "${date_string}" "+%Y:%m:%d %H:%M:%S")

        # write the date to the PDF metadata
        exiftool -DateTimeOriginal="${formatted_date}" -overwrite_original "${filename}"
    fi
done

grob so.
Sedesc schrieb:
Leider kann das neue Programm
hat es einen namen? Kostet es mehr geld, als kein know how dazu inhosue zu haben?
 
Die Thematik dürfte wahrscheinlich komplexer sein:
Ich gehe davon aus, dass die PDFs versioniert sind, von daher lautet grob formuliert der Vorgang.
Dokument auschecken->lokal herunterladen->PDF-Daten aktualisieren (irgendeine Scriptsprache wie VBS, PS plus Hilfstools wie z.B. von @madmax2010 )->geändertes Dokument hochladen->Einchecken

Die Sharepoint-Todos könntest Du via workflows realisieren, je nachdem, wieviele Dokumente angepasst werden müssen. Das spart einige Klicks ;)

Und Edit(h) merkt noch an, dass hoffentlich alle Dokumente das gleiche Dateinamensschema haben ;)
Und noch was: Falls ihr Versionisierungsdaten in den PDFs bzw. Quelldokumenten habt (Datum oder Versionsnummer o.ä.), wird es ungleich aufwendiger.
Ergänzung ()

madmax2010 schrieb:
hat es einen namen? Kostet es mehr geld, als kein know how dazu inhosue zu haben?
Ich vermute, die haben ein neues ERP/DMS und jetzt erst gemerkt, dass man beim Lastenheft sowas nicht beachtet hat. Und nun soll es einer intern richten, da das extern zu teuer wird.
 
Zuletzt bearbeitet:
Zurück
Oben