53 votes

Bibliothèque Unicode en C léger

Je cherche une petite bibliothèque en C pour gérer les chaînes utf8.

Plus précisément, le fractionnement basé sur des délimiteurs unicode pour une utilisation avec des algorithmes de stemming.

Des messages connexes ont été suggérés :

UNITÉ DE SOINS INTENSIFS http://www.icu-project.org/ (Je l'ai trouvé trop encombrant pour mes besoins sur les appareils embarqués)

UTF8-CPP : http://utfcpp.sourceforge.net/ (Excellent, mais C++ et non C)

Est-ce que quelqu'un a trouvé des bibliothèques indépendantes de la plateforme, avec une petite base de code, pour gérer les chaînes unicode (sans avoir besoin de faire de la naturalisation).

Tout conseil serait apprécié.

36voto

Avi Points 14468

Une bibliothèque agréable et légère, que j'utilise avec succès, est la suivante utf8proc .

15voto

xenu Points 91

Il y a aussi MicroUTF-8 .

11voto

Artelius Points 25772

UTF-8 est spécialement conçu pour que de nombreuses fonctions de chaînes de caractères orientées octet continuent à fonctionner ou ne nécessitent que des modifications mineures.

C'est strstr par exemple, fonctionnera parfaitement tant que ses deux entrées seront des chaînes UTF-8 valides et à terminaison nulle. strcpy fonctionne bien tant que sa chaîne d'entrée commence à la limite d'un caractère (par exemple, la valeur de retour de la commande strstr ).

Vous n'avez donc peut-être même pas besoin d'une bibliothèque séparée !

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X