Comment utiliser les caractères unicode dans une expression régulière en Ruby ?

Question

Comment utiliser les caractères unicode dans une expression régulière en Ruby ?

Demandé el 5 de Mars, 2012: Quand la question a-t-elle été
1465 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'essaie d'écrire une ligne de code qui prend une ligne de texte japonais et supprime un certain nombre de caractères. Cependant, j'ai des difficultés à utiliser des caractères unicodes dans l'expression régulière.

J'utilise actuellement text.gsub(/.*?/u, '') mais je reçois l'erreur

'gsub': invalid byte sequence in Windows-31J (Argument error)

Quelqu'un peut-il me dire ce que je fais de manière incorrecte ?

Exemple de texte :

Résultat escompté :

Merci

éditer : # encoding: utf-8 est présent en haut du script.

Demandé el 5 de Mars, 2012 par SomberClock

Answer 1

1 Réponses

Answer 2

2voto

khal Points 2320

Essayez ça :

text.encode('utf-8', 'utf-8').gsub(/《.*?》/u, '')

Répondu el 5 de Mars, 2012 par khal (2320 Points )

Comment utiliser les caractères unicode dans une expression régulière en Ruby ?

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment utiliser les caractères unicode dans une expression régulière en Ruby ?

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: