J'ai une chaîne qui ressemble à ceci:
6Â 918Â 417Â 712
La coupe claire façon de couper cette chaîne (ce que je comprends Python) est simplement de dire que la chaîne est dans une variable nommée s
, nous obtenons:
s.replace('Â ', '')
Cela devrait faire l'affaire. Mais bien sûr, il se plaint de ce que le caractère non-ASCII '\xc2'
dans le fichier blabla.py n'est pas codé.
Je n'ai jamais vraiment pu comprendre comment basculer entre les différents encodages.
Voici le code, c'est vraiment la même chose que ci-dessus, mais maintenant c'est dans le contexte. Le fichier est enregistré en UTF-8 dans le bloc-notes et a l'en-tête suivant:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Le code:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Il ne reçoit pas plus loin que s.replace
...