2 votes

Chaîne encodée en UTF-8 avec cyrillique dans H2O

Je charge un fichier csv en encodage utf-8 avec des chaînes de caractères cyrilliques. Après analyse dans l'interface Flow, je ne vois pas de cyrillique, mais des symboles illisibles comme "пїўпѕЂпѕ™пїђпѕ". Comment puis-je utiliser les chaînes cyrilliques utf-8 dans H2O ?

0voto

Darren Cook Points 5743

Il semble qu'il s'agisse d'un bogue dans l'interface Flow, mais uniquement dans la commande setupParse. Si vous continuez et effectuez l'importation, les données sont importées correctement.

J'ai signalé le bogue, avec des données de test et des captures d'écran (prises dans Firefox) ici :

https://0xdata.atlassian.net/browse/PUBDEV-4640

Si vous avez des informations supplémentaires, ou si le bogue se comporte différemment pour vous, il serait bon de les ajouter à ce rapport de bogue.

-1voto

Smike Points 1

Vérifiez votre fichier csv dans la présentation texte et binaire pour savoir comment le texte cyrillique est encodé, s'il s'agit d'UTF-8, il devrait ressembler à ceci :

Привет

pour le mot

Привет

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X