Discussion:
PDF Dateien kleiner machen
(zu alt für eine Antwort)
Bernd Rakel
2012-07-14 13:14:35 UTC
Permalink
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die Quelldateien
sind hier teilweise sehr groß, 2stellig MiB.

Nachdem ich mit den Ergebnissen bei Google mehr oder weniger ansprechende
Resultate erreichte, frage ich noch mal hier nach. Kennt jemand eine
elegante Lösung ohne kryptische Befehlseingabe wie bei GhostScript, gern
mit grafischer Oberfläche?

Bisher habe ich ein Script für Nautilus gefunden, das aber die Dateien
verändert, so dass sie nicht mehr wie im Original aussehen.

Dann habe ich über den Befehl »gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -
dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r150 -sOutputFile=Ausgang.pdf
Eingang.pdf« durchaus brauchbare Ergebnisse erreicht, aber ich komme auf
maximal knapp 60% mit unveränderten Dateien, geht da noch mehr? Vorgabe
wäre die gute Lesbarkeit am Monitor, ausgedruckt werden die nur selten.

Zusätzlich fand ich noch ein Script »shrinkpdf.sh«, das aber auch nicht so
richtig gut arbeitete.

Welche Möglichkeiten gibt es noch, große PDFs in vernünftiger Qualität so
hoch wie möglich zu komprimieren? Der Weg über Packprogramme zur
Übermittlung ist keine Option, da ich nie weiß, wer von den Empfängern mit
welchen Formaten umgehen kann.

Thx.
Heiko Nocon
2012-07-14 14:19:14 UTC
Permalink
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die Quelldateien
sind hier teilweise sehr groß, 2stellig MiB.
Häh?
Post by Bernd Rakel
Dann habe ich über den Befehl »gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -
dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r150 -sOutputFile=Ausgang.pdf
Eingang.pdf« durchaus brauchbare Ergebnisse erreicht
Aha. Du willst also eigentlich nicht PDF verkleinern, sondern vielmehr
hauptsächlich die darin einzubettetende Bilder (wohl, weil diese
üblicherweise den fettesten Brocken darstellen).

Tja, das macht man am besten vor der PDF-Ausgabe und zwar mit für diesen
Zweck optimierten Anwendungen (sprich: Bildverarbeitung) und ausreichend
Hirnschmalz. Da hat man die Chance, je nach Bildinhalt unterschiedliche
Strategien anzuwenden.

Für optimale Ergebnisse erfordert nämlich z.B. das Farbfoto eines
Dschungels eine völlig andere Herangehensweise als der Scan einer
technischen Zeichnung. Bei ersterem braucht man eigentlich nur die
Auflösung auf die des Zielgeräts zu verringern und dann einen noch
akzeptablen Faktor für die JPEG-Kompression auswählen, bei
Zeichnungsscans ist die Sache aber weitaus komplizierter.

Der PDF-Generator weiß nix von den Bildinhalten und wird in jedem Fall
ein suboptimales Ergebnis liefern. Entweder größer als nötig oder
schlechter als nötig (oder beides gleichzeitig).
ds_Dieter_Schultheis
2012-07-14 14:45:13 UTC
Permalink
Post by Heiko Nocon
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die Quelldateien
sind hier teilweise sehr groß, 2stellig MiB.
Häh?
Post by Bernd Rakel
Dann habe ich über den Befehl »gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -
dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r150 -sOutputFile=Ausgang.pdf
Eingang.pdf« durchaus brauchbare Ergebnisse erreicht
Aha. Du willst also eigentlich nicht PDF verkleinern, sondern vielmehr
hauptsächlich die darin einzubettetende Bilder (wohl, weil diese
üblicherweise den fettesten Brocken darstellen).
Tja, das macht man am besten vor der PDF-Ausgabe und zwar mit für diesen
Zweck optimierten Anwendungen (sprich: Bildverarbeitung) und ausreichend
Hirnschmalz. Da hat man die Chance, je nach Bildinhalt unterschiedliche
Strategien anzuwenden.
Für optimale Ergebnisse erfordert nämlich z.B. das Farbfoto eines
Dschungels eine völlig andere Herangehensweise als der Scan einer
technischen Zeichnung. Bei ersterem braucht man eigentlich nur die
Auflösung auf die des Zielgeräts zu verringern und dann einen noch
akzeptablen Faktor für die JPEG-Kompression auswählen, bei
Zeichnungsscans ist die Sache aber weitaus komplizierter.
Der PDF-Generator weiß nix von den Bildinhalten und wird in jedem Fall
ein suboptimales Ergebnis liefern. Entweder größer als nötig oder
schlechter als nötig (oder beides gleichzeitig).
Den Ansatz, die Bilder vor der Einbettung ins pdf zu optimieren, kann
ich nur zustimmen. Alles andere ist flickschusterei / fusch, da keine
Korrektur an der Quelle.
--
MfG
Dieter
Bernd Rakel
2012-07-15 14:09:49 UTC
Permalink
Post by Heiko Nocon
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die
Quelldateien sind hier teilweise sehr groß, 2stellig MiB.
Häh?
Viele und noch mehr Seiten, teils Texte mit LibreOffice geschrieben und
dann als PDF gespeichert, teils ganzseitige Scans gleich zu PDF
gespeichert, zusammengesetzt mit »pdfsam« zu einer Datei. Das ergibt dann
hier manchmal recht große PDF Dateien, deren Zusendung oder Download ich
niemandem der Empfänger antun möchte, als Beispiel 2stellig MiB eben 15MiB,
die ich deutlich verkleinern möchte zum Versand oder Download.
Post by Heiko Nocon
Post by Bernd Rakel
Dann habe ich über den Befehl »gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -
dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r150 -sOutputFile=Ausgang.pdf
Eingang.pdf« durchaus brauchbare Ergebnisse erreicht
Aha. Du willst also eigentlich nicht PDF verkleinern, sondern vielmehr
hauptsächlich die darin einzubettetende Bilder (wohl, weil diese
üblicherweise den fettesten Brocken darstellen).
Irgendwie ja und nein, es gibt reine Textseiten, andere mit Bildern und
ganze Bilder gescannt und als PDF gespeichert.
Post by Heiko Nocon
Tja, das macht man am besten vor der PDF-Ausgabe und zwar mit für diesen
Zweck optimierten Anwendungen (sprich: Bildverarbeitung) (...)
Ok, dann mal danke an alle zu diesem thread, ich erkenne, dass ich wohl
beim scannen schon so klein wie möglich machen muss. Die rein
geschriebenen und dann als PDF exportierten Seiten werden sich i.d.R. kaum
noch mehr schrumpfen lassen, wobei diese auch nicht das Problem darstellen.

Irgendwie dachte ich nur, dass ich meine am Ende zusammengesetzten PDFs
einfach pauschal schrumpfen könnte.

Thx an alle.
Thomas 'PointedEars' Lahn
2012-07-15 14:26:58 UTC
Permalink
Post by Bernd Rakel
Post by Heiko Nocon
Tja, das macht man am besten vor der PDF-Ausgabe und zwar mit für diesen
Zweck optimierten Anwendungen (sprich: Bildverarbeitung) (...)
Das ist so nicht richtig.
Post by Bernd Rakel
Ok, dann mal danke an alle zu diesem thread, ich erkenne, dass ich wohl
beim scannen schon so klein wie möglich machen muss.
Nein, _nicht_ beim Scannen. In hoher Qualität einscannen (wer weiss, wozu
Du es noch brauchst), dann bearbeiten (z. B. u. a. skalieren und
komprimieren) und dann ins PDF-Dokument einfügen.

Darüberhinaus gibt es bei guten PDF-Editoren aber auch eingebaute JPEG-
Komprimierung, mit der sich noch etwas mehr Reduktion (ggf. zu Lasten der
Qualität) herausholen lässt.

Mit ZIP-komprimierten PDF-Dateien sollten übrigens inzwischen alle Benutzer
zurechtkommen, aber da ist die Reduktion in der Dateigrösse auch nicht so
gross.
--
PointedEars

Please do not Cc: me. / Bitte keine Kopien per E-Mail.
Stefan Enzinger
2012-07-15 15:10:34 UTC
Permalink
Post by Thomas 'PointedEars' Lahn
Nein, _nicht_ beim Scannen. In hoher Qualität einscannen (wer weiss, wozu
Du es noch brauchst), dann bearbeiten (z. B. u. a. skalieren und
komprimieren) und dann ins PDF-Dokument einfügen.
Jep, aber als Bild, nicht als PDF scannen
Bernd Rakel
2012-07-15 16:27:07 UTC
Permalink
Post by Stefan Enzinger
Post by Thomas 'PointedEars' Lahn
Nein, _nicht_ beim Scannen. In hoher Qualität einscannen (wer weiss,
wozu Du es noch brauchst), dann bearbeiten (z. B. u. a. skalieren und
komprimieren) und dann ins PDF-Dokument einfügen.
Jep, aber als Bild, nicht als PDF scannen
Habe mir gerade das »gscan2pdf« installiert, das bietet mir in den ersten
Versuchen als PDF scannen ansprechend kleine PDF Dateien als Ausgabe.
Merlin Weisig
2012-07-15 20:02:05 UTC
Permalink
Post by Stefan Enzinger
Jep, aber als Bild, nicht als PDF scannen
In der Tat!

Viel herausholen kann man auch mit Indizierung der Farben in Bilddateien
nach dem Scannen.

Wer ein bisschen mit Bildbearbeitung vertraut ist, kann hier sehr viel
rausholen, beispielsweise brauch ich für eine DIN-A4-Seite, die ein
Diagramm o.ä. enthält, keine 16 Mio. Farben, mit denen üblicherweise
eingescannt wird.

Nach dem Scanvorgang in guter Qualität reduziere ich in der Regel per
Bildbearbeitung die Auflösung auf 150 dpi. Anschließend schau ich mir
das Bild an, was ich verarbeiten möchte. Ein Diagramm beispielsweise mit
Balken oder Linien in drei oder vier Farben braucht keine
Farbinformationen über 16 Mio. Farben in der gespeicherten Datei. Hier
kann man locker auf 32 oder 64 Farben reduzieren (damit evtl. Übergänge
zwischen den Farben erhalten bleiben)... und dann das Ergebnis betrachten.

Ist man zufrieden, kann man getrost abspeichern und zum nächsten
übergehen. Ob nun als jpg, png o.ä. sei jedem selbst überlassen, die
Dateigröße ist auf jeden Fall drastisch kleiner geworden.

Grüße

Merlin
Ralph Aichinger
2012-07-15 20:11:43 UTC
Permalink
Post by Bernd Rakel
Irgendwie dachte ich nur, dass ich meine am Ende zusammengesetzten PDFs
einfach pauschal schrumpfen könnte.
Kannst du auch, allerdings gibt es keinen "free lunch".

Du mußt dich entscheiden zwischen Auflösung/Qualität der gescannten
Bilder und der Dateigröße. Natürlich gibt es Grenzfälle, wie
Strichvorlagen, z.B. Planzeichnungen, aber bei "typischen"
Scans ist einfach die Bildqualität annähernd proportional zur
Größe. Die Entscheidung ist einfach wie stark du die Auflösung
und/oder Qalität reduzieren willst. Und dabei gibt es im
Normalfall keine Lösung, die eine Größenreduzierung ohne
Qualitätsverlust ermöglicht.

Du kannst das Zeug einfach pauschal schrumpfen. Nur mußt du
dir um die Kompromisse klar werden. Am besten probiere es
aus, drucke auch mal die geschrumpften Sachen aus, damit
du siehst, wie das am Papier kommt.

/ralph
Bernd Rakel
2012-07-16 20:44:48 UTC
Permalink
Post by Bernd Rakel
Irgendwie dachte ich nur, dass ich meine am Ende zusammengesetzten PDFs
einfach pauschal schrumpfen könnte.
(...)
Du kannst das Zeug einfach pauschal schrumpfen. Nur mußt du dir um die
Kompromisse klar werden. Am besten probiere es aus, drucke auch mal die
geschrumpften Sachen aus, damit du siehst, wie das am Papier kommt.
Danke an alle, werde jetzt mal die genannten Hinweise umsetzen. Zumindest
habe ich mit gscan2pdf ein nettes Werkzeug gefunden, dass kleine Dateien
erzeugt. Das spart mir viel Zeit, weil ich keine ocr über die Sachen
laufen lassen muss, sondern gleich als pdf scannen kann.

Ansonsten ist kein Druck vorgesehen, es geht um die hauptsächliche Anzeige
am Monitor des Empfängers. Das sind oft kurzfristige Angelegenheiten.
Thx.
Christoph Schmees
2012-07-18 14:48:52 UTC
Permalink
... Die rein
geschriebenen und dann als PDF exportierten Seiten werden sich i.d.R. kaum
noch mehr schrumpfen lassen, wobei diese auch nicht das Problem darstellen.
probiere mal, die PDF nicht durch "exportiere als PDF" zu
erzeugen, sondern als "drucke auf Datei" und dann als Format PDF.
Oder du installierst dir cups-pdf und druckst auf den.

Christoph
--
email:
nurfuerspam -> gmx
de -> net
Bernd Rakel
2012-07-19 16:38:15 UTC
Permalink
... Die rein geschriebenen und dann als PDF exportierten Seiten werden
sich i.d.R. kaum noch mehr schrumpfen lassen, wobei diese auch nicht
das Problem darstellen.
probiere mal, die PDF nicht durch "exportiere als PDF" zu erzeugen,
sondern als "drucke auf Datei" und dann als Format PDF.
Oder du installierst dir cups-pdf und druckst auf den.
Habe den mal eben installiert und auch so eingestellt, dass ich ihm sagen
kann, wo und wie heißt du speichern. Dann das gleiche File aus Libreoffice
einmal exportiert als PDf und danach gedruckt über cups-pdf.
Original *.odt 288,9KiB
Export *.pdf 75,4KiB
cups-pdf *.pdf 75,9KiB
Alles auf 150 dpi 24bit eingestellt.
Mich deucht, cups-pdf macht es ein wenig größer als das Exportieren als
PDF. In Datei drucken gab es vor cups-pdf nicht in libreoffice 3.5.5.3.

Trotzdem danke, einen Systemweiten Drucker in PDF kann man immer
gebrauchen.

Bernd Mayer
2012-07-14 17:09:36 UTC
Permalink
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die Quelldateien
sind hier teilweise sehr groß, 2stellig MiB.
Nachdem ich mit den Ergebnissen bei Google mehr oder weniger ansprechende
Resultate erreichte, frage ich noch mal hier nach. Kennt jemand eine
elegante Lösung ohne kryptische Befehlseingabe wie bei GhostScript, gern
mit grafischer Oberfläche?
Bisher habe ich ein Script für Nautilus gefunden, das aber die Dateien
verändert, so dass sie nicht mehr wie im Original aussehen.
Dann habe ich über den Befehl »gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -
dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r150 -sOutputFile=Ausgang.pdf
Eingang.pdf« durchaus brauchbare Ergebnisse erreicht, aber ich komme auf
maximal knapp 60% mit unveränderten Dateien, geht da noch mehr? Vorgabe
wäre die gute Lesbarkeit am Monitor, ausgedruckt werden die nur selten.
Zusätzlich fand ich noch ein Script »shrinkpdf.sh«, das aber auch nicht so
richtig gut arbeitete.
Welche Möglichkeiten gibt es noch, große PDFs in vernünftiger Qualität so
hoch wie möglich zu komprimieren? Der Weg über Packprogramme zur
Übermittlung ist keine Option, da ich nie weiß, wer von den Empfängern mit
welchen Formaten umgehen kann.
Hallo,

falls die PDFs viele Bilder enthalten (z.B. von einem Scanner) dann kann
man die Bilder mit pfdfimages extrahieren passend verkleinern und zu
einem neuen PDF zusammenfügen: http://linux.die.net/man/1/pdfimages


Bernd Mayer
Patrick Schueller
2012-07-14 21:03:08 UTC
Permalink
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die Quelldateien
sind hier teilweise sehr groß, 2stellig MiB.
Nachdem ich mit den Ergebnissen bei Google mehr oder weniger ansprechende
Resultate erreichte, frage ich noch mal hier nach. Kennt jemand eine
elegante Lösung ohne kryptische Befehlseingabe wie bei GhostScript, gern
mit grafischer Oberfläche?
Ich mache das hier mit
ps2pdf gross.pdf klein.pdf

Finde ich nicht so besonders kryptisch. Warum das funktioniert, weiß ich
nicht. Ich glaube, ich habe es von hier:
http://pandemoniumillusion.wordpress.com/2008/05/07/compress-a-pdf-with-pdftk/
Man kann den dort genannten 1. Schritt weglassen, ps2pdf nimmt auch pdf
als Input.

Gruß, Patrick
--
OS: Debian GNU/Linux unstable (sid) · Kernel: 3.4-4.towo-siduction-amd64
· KDE: 4.8.4 (4.8.4)
CPU: AMD Turion(tm) Dual-Core Mobile ZM-82 · RAM: 127428kB/3796892kB
VGA: AMD Mobility Radeon HD 3200 / AMD Mobility Radeon HD 3400
John Fanta
2012-07-14 21:38:49 UTC
Permalink
Post by Patrick Schueller
Post by Bernd Rakel
Ich möchte PDF Dateien in ihrer Speichergröße schrumpfen, die
Quelldateien sind hier teilweise sehr groß, 2stellig MiB.
Ich mache das hier mit
ps2pdf gross.pdf klein.pdf
Sehr schön. Vielen Dank!
--
Ich moechte Buendigeres, Einfacheres, Ernsteres, ich moechte mehr Seele
und mehr Liebe und mehr Herz. - Vincent van Gogh
Michael Limburg
2012-07-15 12:09:45 UTC
Permalink
Post by Patrick Schueller
Ich mache das hier mit
ps2pdf gross.pdf klein.pdf
Finde ich nicht so besonders kryptisch. Warum das funktioniert, weiß ich
Funktioniert wegen der Voreinstellungen. Dabei üblicherweise für den
Bildschirm "optimiert". Ausdrucken möchte man die "Ergebnisse" allerdings
dann nicht mehr.
Post by Patrick Schueller
http://pandemoniumillusion.wordpress.com/2008/05/07/compress-a-pdf-with-pdftk/
Man kann den dort genannten 1. Schritt weglassen, ps2pdf nimmt auch pdf
als Input.
Man kann es auch sein lassen, da ps2pdf üblicherweise mit ghostscript sowie
mitinstalliert wird, also beim OP sowieso schon vorhanden ist, und im Prinzip
kaum Anderes macht, als vom OP eh schon beschrieben: Nämlich mittels gs und
diverser Parameter zu konvertieren.

MfG Michael
Loading...