Comment convertir une chaîne de caractères en utf-8 en Python

Question

Comment convertir une chaîne de caractères en utf-8 en Python

Demandé el 15 de Novembre, 2010: Quand la question a-t-elle été
704924 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un navigateur qui envoie des caractères utf-8 à mon serveur Python, mais lorsque je le récupère à partir de la chaîne de requête, l'encodage que Python renvoie est ASCII. Comment puis-je convertir la chaîne en clair en utf-8 ?

NOTE : La chaîne passée depuis le web est déjà encodée en UTF-8, je veux juste que Python la traite comme UTF-8 et non ASCII.

Demandé el 15 de Novembre, 2010 par Bin Chen

1 votes

Essayez ce lien http://evanjones.ca/python-utf8.html

Commenté el 15 de Novembre, 2010 par Mudassir

0 votes

Je pense qu'un meilleur titre serait Comment convertir une chaîne en unicode sans traduction ?

Commenté el 12 de Août, 2016 par Mark0978

3 votes

En 2018, python 3 si vous obtenez l'erreur de décodage ascii faire "some_string".encode('utf-8').decode('utf-8')

Commenté el 26 de Septembre, 2018 par devssh

Answer 1

5 Réponses

Answer 2

309voto

user225312 Points 22699

En Python 2

>>> plain_string = "Hi!"
>>> unicode_string = u"Hi!"
>>> type(plain_string), type(unicode_string)
(<type 'str'>, <type 'unicode'>)

^ C'est la différence entre une chaîne d'octets (plain_string) et une chaîne unicode.

>>> s = "Hello!"
>>> u = unicode(s, "utf-8")

^ Convertir en unicode et spécifier l'encodage.

En Python 3

Toutes les chaînes de caractères sont unicode. Le site unicode n'existe plus. Voir la réponse de @Noumenon

Répondu el 15 de Novembre, 2010 par user225312 (22699 Points )

37 votes

J'obtiens l'erreur suivante : UnicodeDecodeError: 'utf8' codec can't decode byte 0xb0 in position 2: invalid start byte Voici mon code : ret=[] for line in csvReader : cline=[] for elm in line : unicodestr = unicode(elm, 'utf-8') cline.append(unicodestr) ret.append(cline)

Commenté el 22 de Octobre, 2013 par Gopakumar N G

131 votes

Rien de tout cela ne s'applique en Python 3, toutes les chaînes de caractères sont unicode et unicode() n'existe pas.

Commenté el 28 de Août, 2015 par Noumenon

0 votes

C'est un peu comme si c'était hier, mais merci. Cela a corrigé un problème où j'essayais d'imprimer l'unicode et j'obtenais des s.

Commenté el 7 de Février, 2016 par 智障的人

Afficher 4 autres commentaires

Answer 3

83voto

duhaime Points 494

Si les méthodes ci-dessus ne fonctionnent pas, vous pouvez également indiquer à Python d'ignorer les parties d'une chaîne qu'il ne peut pas convertir en utf-8 :

stringnamehere.decode('utf-8', 'ignore')

Répondu el 7 de Octobre, 2013 par duhaime (494 Points )

32 votes

Got AttributeError : L'objet 'str' n'a pas d'attribut 'decode'.

Commenté el 6 de Août, 2018 par saran3h

3 votes

@saran3h il semble que vous utilisiez Python 3, dans ce cas Python debe gère les problèmes d'encodage pour vous. Avez-vous essayé de lire votre document sans spécifier d'encodage ?

Commenté el 6 de Août, 2018 par duhaime

3 votes

Par défaut, Python choisit l'encodage du système. Sous Windows 10, c'est cp1252, ce qui est différent de utf-8. J'ai perdu quelques heures sur ce problème en utilisant codecs.open() dans py 3.8.

Commenté el 1 de Juillet, 2020 par Vishesh Mangla

Answer 4

24voto

Blueswannabe Points 241

C'est peut-être un peu exagéré, mais lorsque je travaille avec de l'ascii et de l'unicode dans les mêmes fichiers, le décodage répété peut être une douleur, c'est ce que j'utilise :

def make_unicode(inp):
    if type(inp) != unicode:
        inp =  inp.decode('utf-8')
    return inp

Répondu el 29 de Novembre, 2014 par Blueswannabe (241 Points )

2 votes

Cela ne fonctionne plus, tel qu'il est écrit... la unicode le type n'existe pas dans python3

Commenté el 26 de Décembre, 2021 par Mike Pennington

Answer 5

16voto

Ken Points 51

Ajoutez la ligne suivante au début de votre fichier .py :

# -*- coding: utf-8 -*-

vous permet d'encoder des chaînes de caractères directement dans votre script, comme ceci :

utfstr = "ボールト"

Répondu el 22 de Mai, 2014 par Ken (51 Points )

2 votes

Ce n'est pas ce que demande le PO. Mais évitez de telles chaînes de caractères de toute façon. Cela crée une chaîne Unicode en Python 3 (bien) mais c'est un bytestring en Python 2 (mal). Soit vous ajoutez from __future__ import unicode_literals en haut de la page ou utilisez u'' préfixe. N'utilisez pas de caractères non ascii dans les éléments suivants bytes littéraux. Pour obtenir des octets utf-8, vous pourriez utf8bytes = unicode_text.encode('utf-8') plus tard si cela s'avère nécessaire.

Commenté el 26 de Avril, 2015 par J.F. Sebastian

1 votes

@jfs comment from __future__ import unicode_literals aidez-moi à convertir une chaîne de caractères non ascii en utf-8 ?

Commenté el 29 de Novembre, 2018 par Ortal Turgeman

0 votes

@OrtalTurgeman Je ne réponds pas à la question. Regardez, c'est un commentaire, pas une réponse. Mon commentaire traite du problème avec le code dans la réponse. Il essaie de créer un bytestring avec des caractères non ascii sur Python 2 (c'est une SyntaxError sur Python 3 - les bytes literals l'interdisent).

Commenté el 29 de Novembre, 2018 par J.F. Sebastian

Answer 6

13voto

codeape Points 38576

Si je comprends bien, vous avez une chaîne d'octets encodée en utf-8 dans votre code.

La conversion d'une chaîne d'octets en une chaîne unicode est appelée décodage (unicode -> chaîne d'octets est un encodage).

Pour ce faire, vous utilisez l'option unicode ou la fonction décoder méthode. Soit :

unicodestr = unicode(bytestr, encoding)
unicodestr = unicode(bytestr, "utf-8")

Ou :

unicodestr = bytestr.decode(encoding)
unicodestr = bytestr.decode("utf-8")

Répondu el 15 de Novembre, 2010 par codeape (38576 Points )

Comment convertir une chaîne de caractères en utf-8 en Python

Réponses

En Python 2

En Python 3

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment convertir une chaîne de caractères en utf-8 en Python

Réponses

En Python 2

En Python 3

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: