Supprimer les caractères de contrôle d'une chaîne en python

Question

Supprimer les caractères de contrôle d'une chaîne en python

Demandé el 1 de Décembre, 2010: Quand la question a-t-elle été
56049 affichage: Nombre de visites la question a
3 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

j'ai actuellement le code suivant

 def removeControlCharacters(line):
    i = 0
    for c in line:
        if (c < chr(32)):
            line = line[:i - 1] + line[i+1:]
            i += 1
    return line

Cela ne fonctionne tout simplement pas s'il y a plus d'un caractère à supprimer.

Demandé el 1 de Décembre, 2010 par David

Answer 1

3 Réponses

Answer 2

30voto

SilentGhost Points 79627

Vous pouvez utiliser str.translate avec la carte appropriée, par exemple comme ceci :

 >>> mpa = dict.fromkeys(range(32))
>>> 'abc\02de'.translate(mpa)
'abcde'

Répondu el 1 de Décembre, 2010 par SilentGhost (79627 Points )

Answer 3

19voto

irdb Points 11

Toute personne intéressée par une classe de caractères regex qui correspond à n'importe quel caractère de contrôle Unicode peut utiliser [\x00-\x1f\x7f-\x9f] .

Vous pouvez le tester comme ceci :

 >>> import unicodedata, re, sys
>>> all_chars = [chr(i) for i in range(sys.maxunicode)]
>>> control_chars = ''.join(c for c in all_chars if unicodedata.category(c) == 'Cc')
>>> expanded_class = ''.join(c for c in all_chars if re.match(r'[\x00-\x1f\x7f-\x9f]', c))
>>> control_chars == expanded_class
True

Donc, pour supprimer les caractères de contrôle à l'aide de re utilisez simplement ce qui suit :

 >>> re.sub(r'[\x00-\x1f\x7f-\x9f]', '', 'abc\02de')
'abcde'

Répondu el 9 de Septembre, 2016 par irdb (11 Points )

Answer 4

8voto

Mark Byers Points 318575

Votre implémentation est erronée car la valeur de i est incorrecte. Cependant, ce n'est pas le seul problème : il utilise également à plusieurs reprises des opérations de chaîne lentes, ce qui signifie qu'il s'exécute en O(n ² ) au lieu de O(n). Essayez plutôt ceci :

 return ''.join(c for c in line if ord(c) >= 32)

Répondu el 1 de Décembre, 2010 par Mark Byers (318575 Points )

Supprimer les caractères de contrôle d'une chaîne en python

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Supprimer les caractères de contrôle d'une chaîne en python

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: