10 votes

pdftk ne décompressera pas les flux de données

J'ai essayé de travailler avec pdftk pour inspecter les informations des flux pdf compressés créés par Nitro Reader, mais pdftk ne déflate pas les flux. Il ne produit pas d'erreurs, mais il ne semble pas faire autre chose que de réordonner les objets pdf. Ici est un exemple minimal d'un de ces pdfs.

    pdftk test.pdf output test-d.pdf uncompress

Lorsque j'essaie pdftk sur d'autres pdfs, il semble fonctionner correctement. Si j'extrais manuellement les flux de données et les décompresse en utilisant zlib dans Python, ils se décompressent correctement. De même, si j'ouvre le pdf dans Adobe Reader et le réenregistre, pdftk fonctionne correctement sur le pdf résultant.

J'ai inspecté manuellement le pdf de Nitro du mieux que j'ai pu, et il semble être un pdf valide. Je suis très confus quant à ce qui se passe ici.

Pour situer le problème, j'ai des centaines de ces pdfs, et j'essaie de rechercher certains mots-clés, ce que je devrais pouvoir faire si je peux automatiser la décompression.

pdftk version 1.45
Windows 7 Home Premium SP1
Nitro Reader 2 version 2.5.0.36

Merci, James

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X