J'analyse un fichier HTML avec Beautiful Soup 3, mais il contient des entités HTML que Beautiful Soup 3 ne décode pas automatiquement pour moi :
>>> from BeautifulSoup import BeautifulSoup
>>> soup = BeautifulSoup("<p>£682m</p>")
>>> text = soup.find("p").string
>>> print text
£682m
Comment puis-je décoder les entités HTML dans text
pour obtenir "£682m"
au lieu de "£682m"
.
3 votes
Liés : Convertir des entités XML/HTML en chaîne Unicode en Python