J'ai essayé de travailler avec pdftk pour inspecter les informations des flux pdf compressés créés par Nitro Reader, mais pdftk ne déflate pas les flux. Il ne produit pas d'erreurs, mais il ne semble pas faire autre chose que de réordonner les objets pdf. Ici est un exemple minimal d'un de ces pdfs.
pdftk test.pdf output test-d.pdf uncompress
Lorsque j'essaie pdftk sur d'autres pdfs, il semble fonctionner correctement. Si j'extrais manuellement les flux de données et les décompresse en utilisant zlib dans Python, ils se décompressent correctement. De même, si j'ouvre le pdf dans Adobe Reader et le réenregistre, pdftk fonctionne correctement sur le pdf résultant.
J'ai inspecté manuellement le pdf de Nitro du mieux que j'ai pu, et il semble être un pdf valide. Je suis très confus quant à ce qui se passe ici.
Pour situer le problème, j'ai des centaines de ces pdfs, et j'essaie de rechercher certains mots-clés, ce que je devrais pouvoir faire si je peux automatiser la décompression.
pdftk version 1.45
Windows 7 Home Premium SP1
Nitro Reader 2 version 2.5.0.36
Merci, James