Je sais que bytes.decode
donne une chaîne de caractères et string.encode
donne les octets, mais seulement si l'octet correct encoding
est utilisé.
Supposons que j'ai un objet octets codé en utilisant gb18030
Si j'essaie de le décoder en utilisant big5
:
>>name = ' damon'
>>b1 = name.encode('gb18030')
>>> b1.decode('big5')
UnicodeDecodeError: 'big5' codec can't decode byte 0xc8 in position 2: illegal multibyte sequence
Existe-t-il un moyen de trouver l'encodage à partir d'un fichier bytes
objet ?
Je n'ai pas pu trouver d'api utile à cet égard dans python3
docs.