66 votes

UTF-8 peut-il contenir zéro octet ?

La chaîne UTF-8 peut-elle contenir des zéros ? Je vais l'envoyer via le protocole de texte brut ascii, dois-je l'encoder avec quelque chose comme base64 ?

3voto

Michael Petrotta Points 35647

Le texte ASCII est limité aux valeurs d'octets comprises entre 0 et 127. Le texte UTF-8 n'a pas une telle restriction - le texte codé avec UTF-8 peut avoir son bit de poids fort. Il n'est donc pas sûr d'envoyer du texte UTF-8 sur un canal qui ne garantit pas un passage sûr pour ce bit haut.

Si vous êtes obligé de gérer un canal ASCII uniquement, Base-64 est un choix raisonnable (mais pas particulièrement économe en espace). Êtes-vous sûr d'être limité aux données 7 bits ? C'est un peu inhabituel de nos jours.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X