J'importe un fichier CSV dans Ruby (1.8.7). File.open('path/to/file.csv').read renvoie ceci dans la console :
Stefan,Engstr\232m
L'encodage est identifié comme iso-8859-2 par UniversalDetector (chardet gem).
UniversalDetector::chardet("Stefan,Engstr\232m")
=> {"confidence"=>0.626936305574385, "encoding"=>"ISO-8859-2"}
En essayant de convertir la chaîne de caractères, on obtient le résultat suivant :
Iconv.conv("UTF-8", "ISO-8859-2", "Stefan,Engstr\232m")
=> "Stefan,Engstrm"
alors que je m'y attendais :
=> "Stefan,Engström"
- La chaîne pourrait-elle vraiment être dans un autre encodage ?
- Je n'ai pas vu le \232 avant, généralement lorsque les chaînes de caractères sont codées de manière étrange, un caractère bizarre apparaîtra à la place, par exemple un caractère chinois.
Faites-moi savoir si je dois fournir plus d'informations ou préciser quelque chose.