J'ai essayé de chercher stackoverflow de trouver une réponse à cela, mais les questions et les réponses que j'ai trouvé sont autour de 10 ans et je n'arrive pas à trouver un consensus sur le sujet en raison de changements et de progrès possibles.
Il existe plusieurs bibliothèques que je sais de l'extérieur de la stl qui sont censés manipuler unicode
- http://userguide.icu-project.org/
- https://github.com/nemtrif/utfcpp
- https://github.com/CaptainCrowbar/unicorn-lib
Il ya quelques caractéristiques de la stl (wstring,codecvt_utf8) qui ont été inclus, mais les gens semblent être ambivalents à l'égard de l'aide parce qu'ils traitent de l'UTF-16 qui ce site: (utf-8 partout) dit ne doit pas être utilisé et beaucoup de gens en ligne semble d'accord avec la prémisse.
La seule chose que je suis à la recherche de la possibilité de faire 4 choses avec une des chaînes unicode-
- Lire une chaîne de caractères dans la mémoire
- Recherche de la chaîne regex utilisant unicode ou ascii, concaténer ou faire de remplacement de texte/mise en forme avec avec ascii+unicode des chiffres ou des caractères.
- Convertir ascii + le numéro unicode format pour les caractères qui ne rentrent pas dans la plage ascii.
- Écrire une chaîne de caractères sur le disque ou l'envoyer n'importe où.
À partir de ce que je peux dire icu gère cela et plus encore. Ce que je voudrais savoir c'est si il existe un moyen standard de la manipulation de ce sur Linux, Windows et MacOS.
Je vous remercie pour votre temps.