Ceci peut aider à faire la lumière : (de la page 11 de PDF32000.book)
La syntaxe du PDF est mieux comprise si on la considère comme composée de quatre parties, comme le montre la figure 1 :
- Des objets. Un document PDF est une structure de données composée d'un petit ensemble de types de base d'objets de données. La sous-clause 7.2, " Conventions lexicales ", décrit le jeu de caractères utilisé pour écrire les objets et autres éléments syntaxiques. éléments syntaxiques. La sous-clause 7.3, "Objets", décrit la syntaxe et les propriétés essentielles des objets. La sous-clause 7.3.8, "Stream Objects", fournit des détails complets sur le type de données le plus complexe, le stream de flux.
- Structure du fichier. La structure du fichier PDF détermine la manière dont les objets sont stockés dans un fichier PDF, comment ils sont comment ils sont accessibles et comment ils sont mis à jour. Cette structure est indépendante de la sémantique des objets. Sous- clause 7.5, "Structure des fichiers", décrit la structure des fichiers. La sous-clause 7.6, "Cryptage", décrit un mécanisme de protection du pour protéger le contenu d'un document contre tout accès non autorisé.
- Structure du document. La structure du document PDF spécifie comment les types d'objets de base sont utilisés pour représenter les composants d'un document PDF : pages, polices, annotations, etc. La sous-clause 7.7, "Structure du document", décrit la structure globale du document ; les clauses suivantes traitent de la sémantique détaillée des composants. sémantique détaillée des composants.
- Flux de contenu. Un flux de contenu PDF contient une séquence d'instructions décrivant l'apparence d'une page ou d'une autre entité graphique. une page ou une autre entité graphique. Ces instructions, bien qu'elles soient également représentées sous forme d'objets, sont conceptuellement distinctes des objets qui représentent la structure du document et sont décrites séparément. distinctes des objets qui représentent la structure du document et sont décrites séparément. Sous-clause 7.8, "Flux de contenu et ressources", traite des flux de contenu PDF et de leurs ressources associées.
Il semble que la navigation dans un fichier PDF nécessitera un peu plus qu'un simple effort.