J'essaie d'écrire une ligne de code qui prend une ligne de texte japonais et supprime un certain nombre de caractères. Cependant, j'ai des difficultés à utiliser des caractères unicodes dans l'expression régulière.
J'utilise actuellement text.gsub(/.*?/u, '')
mais je reçois l'erreur
'gsub': invalid byte sequence in Windows-31J (Argument error)
Quelqu'un peut-il me dire ce que je fais de manière incorrecte ?
Exemple de texte :
Résultat escompté :
Merci
éditer : # encoding: utf-8
est présent en haut du script.