Les éléments suivants remplaceront les caractères de contrôle ASCII (abréviation de [\x00-\x1F\x7F]
) :
my_string.replaceAll("\\p{Cntrl}", "?");
Le texte suivant remplacera tous les caractères non imprimables ASCII (abréviation de [\p{Graph}\x20]
), y compris les caractères accentués :
my_string.replaceAll("[^\\p{Print}]", "?");
Toutefois, ni l'un ni l'autre ne fonctionne pour les chaînes Unicode. Quelqu'un connaît-il un bon moyen de supprimer les caractères non imprimables d'une chaîne unicode ?
2 votes
Juste un addendum : la liste des catégories générales d'Unicode peut être trouvée dans UAX #44
1 votes
Duplicata possible de Le moyen le plus rapide de supprimer tous les caractères non imprimables d'une chaîne Java
1 votes
@Stewart : salut, avez-vous regardé les questions/réponses en dehors du titre ?!?
1 votes
@Stewart : cette autre question ne couvre que le sous-ensemble ascii des caractères non imprimables !!!