Mr. Brooks
Lt. Commander
- Registriert
- Aug. 2011
- Beiträge
- 1.441
Hallo,
ich versuche gerade jede Seite einer PDF als einzelne Bilddatei zu extrahieren um diese dann weiterverarbeiten zu können. Das hab ich bisher mit einem Script mit dem Tool "pdfimages" gemacht. Das Tool erkennt aber leider einzelne Seiten mit 1x1px. ImageMagick oder GraphicsMagick geben eine schlechte Qualität aus, wenn ich keine zusätzlichen Optionen wie die Auflösung (-density) mit angebe. Das soll aber auch nicht gemacht werden, jede PDF-Datei und teils auch jede Seite einer PDF haben ja individuelle Auflösungen. Verschiedene Windows-Tools können das ja auch. Zum Bsp. gibt mit PDF xChangeEditor jede Seite in gleicher Qualität wie das Original aus und jede Seite hat eine unterschiedliche Größe, so wie es mit im PDF-Reader angezeigt wird.
Müsste ich jetzt erst umständlich die Größe für jede Seite auslesen und dann an den IM/GM-Aufruf weitergeben? Ich finde nichts wie die Tools das selber ermitteln können. Das gleiche trifft scheinbar auch auf Ghostscript zu.
Hatte auch gelesen, dass PDF "keine echte Auflösung" hat, keine Ahnung was damit gemeint sein soll. Wie kann ein Bild keine Auflösung haben?
Ich arbeite unter Ubuntu, nicht Windows.
Mr. Brooks
ich versuche gerade jede Seite einer PDF als einzelne Bilddatei zu extrahieren um diese dann weiterverarbeiten zu können. Das hab ich bisher mit einem Script mit dem Tool "pdfimages" gemacht. Das Tool erkennt aber leider einzelne Seiten mit 1x1px. ImageMagick oder GraphicsMagick geben eine schlechte Qualität aus, wenn ich keine zusätzlichen Optionen wie die Auflösung (-density) mit angebe. Das soll aber auch nicht gemacht werden, jede PDF-Datei und teils auch jede Seite einer PDF haben ja individuelle Auflösungen. Verschiedene Windows-Tools können das ja auch. Zum Bsp. gibt mit PDF xChangeEditor jede Seite in gleicher Qualität wie das Original aus und jede Seite hat eine unterschiedliche Größe, so wie es mit im PDF-Reader angezeigt wird.
Müsste ich jetzt erst umständlich die Größe für jede Seite auslesen und dann an den IM/GM-Aufruf weitergeben? Ich finde nichts wie die Tools das selber ermitteln können. Das gleiche trifft scheinbar auch auf Ghostscript zu.
Hatte auch gelesen, dass PDF "keine echte Auflösung" hat, keine Ahnung was damit gemeint sein soll. Wie kann ein Bild keine Auflösung haben?
Ich arbeite unter Ubuntu, nicht Windows.
Mr. Brooks