Je suis en train de faire des recherches sur les pages de code et j'ai trouvé de nombreuses utilisations conflictuelles des termes, même parmi différentes entrées de Wikipédia. Je ne trouve tout simplement pas de source d'information qui détaille l'ensemble du processus de manipulation des caractères du début à la fin. Est-ce que quelqu'un qui connaît bien ce domaine pourrait suggérer des façons dont les informations suivantes sont inexactes ou incorrectes :
Le processus de représentation des caractères tel que je le comprends :
-
Nous commençons avec des ensembles de symboles (je ne suis pas sûr du terme correct, peut-être 'scripts') qui ne sont pas associés à une plateforme spécifique. Par exemple, l'alphabet cyrillique est compris de la même manière dans le contexte de Windows que dans Linux.
-
Les membres de ces ensembles sont sélectionnés, généralement par paquets, par les vendeurs pour former un jeu de caractères spécifique à une plateforme. La plateforme pourrait assigner divers codes à ces ensembles tels que des valeurs GDI sur Windows (par exemple 0 pour ANSI_CHARSET et les autres codes mentionnés ici: http://asa.diac24.net/wiki/index.php?title=ASS:fe&printable=yes). Je ne trouve pas beaucoup d'informations sur ces ensembles, comme par exemple s'ils sont en fait des jeux de caractères codés ou s'ils sont simplement désordonnés et abstraits.
-
A partir de ces ensembles, des pages de codes individuelles sont développées qui semblent avoir une relation de correspondance un à un avec les valeurs GDI. Puisque ces valeurs GDI semblent représenter des ensembles qui dépendent de la plateforme, est-ce que cela signifie que les pages de code Windows sont essentiellement une version codée de chaque ensemble individuel ?
J'ai du mal à concilier cette idée avec un lien qui m'a été montré plus tôt (que j'ai perdu) et qui montrait une correspondance de un à plusieurs entre ces ensembles de caractères GDI et les pages de codes sur différentes plateformes. Est-ce exact, est-ce que ces valeurs GDI pointent vers des ensembles à partir desquels différentes pages de codes sur différentes plateformes peuvent être développées ?
-
Chaque page de code fait correspondre un membre d'un ensemble de caractères abstrait à un entier pour représenter sa position dans l'ensemble. Dans le cas des pages de codes 'simplistes' mentionnées sur la page web ci-dessus, celles-ci peuvent être désignées en utilisant le terme plus précis de 'carte de caractères'. Est-il utile de considérer ce terme ou la distinction est-elle trop subtile et sans importance ?
-
Une police de caractères résout un point de code en un glyphe s'il en contient un pour ce point de code, sinon il signale un échec. J'ai également lu qu'une police de caractères peut renvoyer son propre glyphe vide pour les points de code qu'elle ne supporte pas. Est-ce qu'une application peut faire la différence entre ce glyphe vide et une résolution réussie, c'est-à-dire que la police renvoie un code d'erreur de sorte avec ce glyphe vide ?
Je pense que c'est l'étendue de ma confusion. Toute clarification à ce sujet serait inestimable. Merci d'avance.