UnicodeDecodeError, octet de continuation invalide

Question

UnicodeDecodeError, octet de continuation invalide

Demandé el 5 de Avril, 2011: Quand la question a-t-elle été
38937 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Pourquoi l'élément ci-dessous est-il défaillant ? Pourquoi cela réussit-il avec le codec "latin-1" ?

o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving
v = o.decode("utf-8")

Ce qui a pour conséquence :

 Traceback (most recent call last):  
 File "<stdin>", line 1, in <module>  
 File "C:\Python27\lib\encodings\utf_8.py",
 line 16, in decode
     return codecs.utf_8_decode(input, errors, True) UnicodeDecodeError:
 'utf8' codec can't decode byte 0xe9 in position 10: invalid continuation byte

Demandé el 5 de Avril, 2011 par RuiDC

Answer 1

5 Réponses

Answer 2

20voto

Anshul Singh Suryan Points 68

Utilisez ceci, s'il montre l'erreur de UTF-8

pd.read_csv('File_name.csv',encoding='latin-1')

Répondu el 14 de Avril, 2020 par Anshul Singh Suryan (68 Points )

Answer 3

14voto

surya Points 121

L'erreur de code utf-8 survient généralement lorsque la plage des valeurs numériques dépasse 0 à 127.

la raison de lever cette exception est :

1)Si le point de code est < 128, chaque octet est identique à la valeur du point de code. 2) Si le point de code est égal ou supérieur à 128, la chaîne Unicode ne peut pas être représentée dans cet encodage. (Python lève une exception UnicodeEncodeError dans ce cas).

Pour surmonter ce problème, nous disposons d'un ensemble de codages, le plus largement utilisé étant le "Latin-1, également connu sous le nom d'ISO-8859-1".

Ainsi, les points Unicode 0-255 de l'ISO-8859-1 sont identiques aux valeurs Latin-1, de sorte que la conversion vers cet encodage nécessite simplement de convertir les points de code en valeurs d'octets ; si un point de code supérieur à 255 est rencontré, la chaîne ne peut pas être encodée en Latin-1

lorsque cette exception se produit lorsque vous essayez de charger un ensemble de données ,essayez d'utiliser ce format

df=pd.read_csv("top50.csv",encoding='ISO-8859-1')

Ajoutez la technique d'encodage à la fin de la syntaxe qui accepte ensuite de charger l'ensemble de données.

Répondu el 18 de Janvier, 2020 par surya (121 Points )

0 votes

Bonjour et bienvenue à SO ! S'il vous plaît modifier votre réponse pour vous assurer qu'elle améliore les autres réponses déjà présentes dans cette question.

Commenté el 18 de Janvier, 2020 par hongsy

Answer 4

10voto

Aditya Aggarwal Points 90

Ce type d'erreur survient lorsque vous saisissez un fichier ou des données particulières dans pandas, par exemple : -.

data=pd.read_csv('/kaggle/input/fertilizers-by-product-fao/FertilizersProduct.csv)

Ensuite, l'erreur s'affiche comme ceci :- UnicodeDecodeError : Le codec 'utf-8' ne peut pas décoder l'octet 0xf4 en position 1 : octet de continuation invalide.

Ainsi, pour éviter ce type d'erreur, on peut le supprimer en ajoutant un argument

data=pd.read_csv('/kaggle/input/fertilizers-by-product-fao/FertilizersProduct.csv', encoding='ISO-8859-1')

Répondu el 26 de Juin, 2020 par Aditya Aggarwal (90 Points )

0 votes

Veuillez formater votre code correctement, cliquez ici pour savoir comment .

Commenté el 26 de Juin, 2020 par Богдан Опир

Answer 5

9voto

Alon Gouldman Points 363

Cela m'est arrivé aussi, alors que je lisais un texte contenant de l'hébreu d'une .txt fichier.

J'ai cliqué : file -> save as et j'ai enregistré ce fichier comme un UTF-8 codage

Répondu el 21 de Février, 2019 par Alon Gouldman (363 Points )

Answer 6

1voto

Martin Taco Points 21

Dans ce cas, j'ai essayé d'exécuter un .py qui active un path/file.sql.

Ma solution a été de modifier la codification du fichier.sql en "UTF-8 sans BOM" et ça marche !

Vous pouvez le faire avec Notepad++.

Je vais laisser une partie de mon code.

/ Code /

con=psycopg2.connect(host = sys.argv[1], port = sys.argv[2],dbname = sys.argv[3],user = sys.argv[4], password = sys.argv[5])

curseur = con.cursor() sqlfile = open(path, 'r')

Répondu el 19 de Juin, 2019 par Martin Taco (21 Points )

UnicodeDecodeError, octet de continuation invalide

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

UnicodeDecodeError, octet de continuation invalide

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: