Comment puis-je réduire la taille d'un fichier PDF numérisé?

J'ai un fichier PDF de 72,9 Mo que je dois réduire à moins de 500 Ko.

Le fichier était une image JPEG que j'avais numérisée, puis convertie en pdf.

Utilisez ce qui suit ghostscript commande:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \-dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf

Résumé de -dPDFSETTINGS:

  • -dPDFSETTINGS=/screen qualité inférieure, taille plus petite. (72 dpi)
  • -dPDFSETTINGS=/ebook pour des PDF de meilleure qualité, mais légèrement plus volumineux. (150 dpi)
  • -dPDFSETTINGS=/prepress sortie similaire au paramètre Acrobat Distiller "Prépresse optimisée" (300 dpi)
  • -dPDFSETTINGS=/printer sélectionne une sortie similaire au paramètre "Print Optimized" d'Acrobat Distiller (300 dpi)
  • -dPDFSETTINGS=/default sélectionne la sortie destinée à être utile dans une grande variété d'utilisations, éventuellement au détriment d'un fichier de sortie plus volumineux

Référence: https://www.ghostscript.com/doc/current/VectorDevices.htm#PSPDF_IN:

Contrôles et fonctionnalités spécifiques à la saisie PostScript et PDF

-dPDFSETTINGS=configuration

Préréglages les "paramètres du distillateur"sur l'un des quatre paramètres prédéfinis:

  • /screen sélectionne une sortie basse résolution similaire au paramètre "Screen Optimized" d'Acrobat Distiller (jusqu'à la version X).
  • /ebook sélectionne une sortie de résolution moyenne similaire au paramètre "eBook" d & apos; Acrobat Distiller (jusqu & apos; à la version X).
  • /printer sélectionne une sortie similaire au paramètre "Print Optimized" d'Acrobat Distiller (jusqu'à la version X).
  • /prepress sélectionne une sortie similaire au paramètre "Prépresse optimisée" d'Acrobat Distiller (jusqu'à la version X).
  • /default sélectionne la sortie destinée à être utile dans une grande variété d'utilisations, éventuellement au détriment d'un fichier de sortie plus volumineux.

Les paramètres exacts de chacun d'entre eux, y compris leurs valeurs DPI, sont indiqués dans les dizaines d'options de ce tableau: https://www.ghostscript.com/doc/current/VectorDevices.htm#distillerparams.

Ma façon préférée de le faire est de convertir le PDF en PostScript et inversement. Cela ne fonctionne pas toujours, cependant, mais quand cela fonctionne, les résultats sont agréables:

ps2pdf input.pdf output.pdf

Cela fonctionne également directement sur les PDF, comme suggéré dans les commentaires.

Certains utilisateurs signalent également plus de succès lors de l'utilisation les paramètres de l'ebook comme suit:

ps2pdf -dPDFSETTINGS=/ebook input.pdf output.pdf

aking1012 a raison. Avec plus d'informations sur les images intégrées possibles, les hyperliens, etc.. il serait beaucoup plus facile de répondre à cette question!

Voici quelques solutions de script et de ligne de commande. Utilisez comme bon vous semble.

Si vous avez un pdf avec images numérisées, vous pouvez utiliser convert (ImageMagick) pour créer un pdf avec compression jpeg (Vous pouvez utiliser cette méthode sur n'importe quel pdf, mais vous perdrez toutes les informations textuelles).

Exemple:

convert -density 200x200 -quality 60 -compress jpeg input.pdf output.pdf

Ajustez les paramètres à vos besoins

  • -densité: la densité de pixels en dpi (par exemple 100x100). Des densités de pixels plus élevées augmentent la qualité et la taille
  • -qualité: le taux de compression. Pour jpg, il est compris entre 1 et 100 avec 100 la meilleure qualité, mais la compression la plus faible
  • -compresser: l'algorithme de compression. jpeg compression ce n'est peut-être pas le meilleur choix en raison des artefacts de compression. Vous avez le choix entre BZip, Fax, Group4, JPEG, JPEG2000, Lossless, LZW, RLE ou Zip comme méthodes de compression alternatives (certaines n'autorisent que les images n/b).

J'ai pu obtenir d'excellents taux de compression pour les documents numérisés/photographiés (en fonction des paramètres). Selon la source du document, vous souhaiterez peut-être réduire la profondeur de couleur (-depth argument).

J'avais besoin de réduire la taille d'un PDF contenant des numérisations en couleur d'un document. Chacune de mes pages était une image en couleur en ce qui concerne le fichier. Il s'agissait d'images de pages contenant du texte et des images, mais elles ont été créées en numérisant vers une image.

J'ai utilisé une combinaison de la commande ghostscript ci-dessous et d'une autre d'un autre thread.

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dDownsampleColorImages=true \-dColorImageResolution=150 -dNOPAUSE  -dBATCH -sOutputFile=output.pdf input.pdf

Cela a réduit la résolution de l'image à 150 dpi, réduisant la taille de mon fichier de moitié. En regardant le document, il n'y avait presque aucune perte notable de qualité d'image. Le texte est toujours parfaitement lisible sur mon Nexus7 2012.

Voici un script pour réécrire des PDF numérisés:

#!/bin/shgs  -q -dNOPAUSE -dBATCH -dSAFER \    -sDEVICE=pdfwrite \    -dCompatibilityLevel=1.3 \    -dPDFSETTINGS=/screen \    -dEmbedAllFonts=true \    -dSubsetFonts=true \    -dColorImageDownsampleType=/Bicubic \    -dColorImageResolution=72 \    -dGrayImageDownsampleType=/Bicubic \    -dGrayImageResolution=72 \    -dMonoImageDownsampleType=/Bicubic \    -dMonoImageResolution=72 \    -sOutputFile=out.pdf \     $1

Vous pouvez le personnaliser un peu pour le rendre plus réutilisable, mais si vous n'avez qu'un seul pdf, vous pouvez simplement le remplacer $1 avec votre nom de fichier pdf et placez-le dans un terminal.

  1. J'utilise Dessin de LibreOffice pour ouvrir le pdf.
  2. J'ai ensuite "exporter au format pdf"
  3. Et définissez "qualité de compression jpeg" sur 50% et "résolution d'image" sur 150 dpi

Cela aura un bon résultat.

J'utilise généralement ps2pdf pour ce faire (syntaxe plus facile), quelque chose comme ceci:

ps2pdf -dPDFSETTINGS=/ebook BiggerPdf SmallerPDF

J'utilise le script python suivant pour réduire la taille de tous les fichiers pdf dans un répertoire sur un serveur de production (8.04). Donc ça devrait marcher.

#!/usr/bin/pythonimport osfor fich in os.listdir('.'):        if fich[-3:]=="pdf":                os.system("ps2pdf -dPDFSETTINGS=/ebook %s reduc/%s" % (fich,fich))

Le mieux pour moi était

convert -compress Zip -density 150x150 input.pdf output.pdf

Autres moyens:

#### gsgs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf $INPUTFILE### pdf2ps && ps2pdfpdf2ps input.pdf output.ps && ps2pdf output.ps output.pdf### Webservicehttp://compress.smallpdf.com/de

égard

Je recommande vivement taille du fichier pdfopt.

Il est beaucoup plus efficace en termes de réduction de taille que n'importe lequel des logiciels CLI et GUI précédents que j'ai essayés (y compris convert, gs, pdftk, etc.)- bien que peut-être plus lent avec pngout activé—, et n'a pas certains de leurs problèmes (pas d'images fortement pixélisées/dégradées, pas de perte de métadonnées telles que la table des matières, etc.).

Maintenant, si vous devez atteindre une certaine taille quelles qu'en soient les conséquences (inc. dégradant les images à un point d'illisibilité), ce n'est peut-être pas l'outil dont vous avez besoin, mais en tant que solution toujours fonctionnelle, pour réduire les grandes tailles inutiles dans les PDF sans perdre en lisibilité, en informations et en qualité d'image acceptable, je pense que c'est la meilleure option. (Remarque: J'ai tendance à l'utiliser après avoir d'abord effectué une vectorisation-OCR dans Adobe Acrobat [la fonction s'appelait auparavant "CleanScan"], ce qui peut avoir un impact considérable sur la taille de certains documents texte numérisés.)


Je recommande le installation Unix générique:

  1. Installer toutes les dépendances requises:
  1. Téléchargez et installez l'exécutable:

     curl -L -o https://raw.githubusercontent.com/pts/pdfsizeopt/master/pdfsizeopt.single chmod +x pdfsizeopt.single cp pdfsizeopt.single /usr/local/bin/pdfsizeopt

Utilisation:

pdfsizeopt original.pdf [compressed.pdf]

Note pour Mac utilisateurs trouvant ce message( ou utilisateurs de Linuxbrew): il existe une formule d'installation Homebrew:

brew install --HEAD pts/utils/pdfsizeopt

cela dépend de ce qui consomme l’espace…besoin de beaucoup plus d’informations. la compression de l’espace image peut aider, mais si vous essayez une pulvérisation de tas de fichiers volumineux, cela ne fonctionnera pas. sérieusement besoin de plus d’informations.

convertissez-le en DjVu, au lieu d’essayer de réduire à un PDF de taille impossible (selon la source)

PDF en PS n’est pas efficace dans un fichier PDF numérisé, j’essaie de convertir un pdf de 56 Mo en fichier ps mais le fichier ps est converti en 1,3 Go et encore une fois ps2pdf est converti en fichier de 45 Mo

Cela semble seulement aider un peu à la taille des fichiers, mais ‘pdfopt’ a une syntaxe simple et améliore la vitesse de chargement et de rotation des pages à l’ère de l’iPad. :slight_smile:

le fichier était une image jpeg que j’avais numérisée, puis convertie en pdf.

Veuillez consulter ce lien Q&A pour un certain nombre de frontaux d’interface GRAPHIQUE à ghostscript qui devraient faciliter le processus de réduction de la taille des fichiers PDF.

Notez que le PO semble avoir accidentellement marqué la mauvaise réponse comme acceptée. Son commentaire d’accompagnement remercie la solution ghostscript, qui a résolu le problème, mais ghostscript n’apparaît pas dans cette réponse mais dans une autre.