6 votes

Télécharger une image en Python avec lxml

J'ai besoin de trouver une image dans un code HTML similaire à celui-ci :

...
<a href="stackoverflow.com/example/1"> 
    <img id="img" src="http://example.net/example.jpg" alt="Example" />
</a>
...

J'utilise lxml et requests.

Voici le code :

import lxml
from lxml import html
import requests

url = 'http://www.example.com'

r = requests.get(url)
tree = lxml.html.fromstring(r.content)

img = tree.get_element_by_id("img")
f = open("image.jpg",'wb')
f.write(requests.get(img['src']).content)

Mais je reçois une erreur :

Traceback (most recent call last):
  File "/Users/Name/Documents/Python/Example/Script.py", line 13, in <module>
    s = requests.get(img['src'])
  File "/Library/Python/2.6/site-packages/lxml/lxml.etree.pyx", line 1052, in lxml.etree._Element.__getitem__ (src/lxml/lxml.etree.c:38272)
TypeError: 'str' object cannot be interpreted as an index

Des suggestions ?

5voto

asciimoo Points 561

Essayez f.write(requests.get(img.attrib['src']).content)

1voto

Hugh Bothwell Points 22635
import lxml.html
import requests

url = 'http://www.example.com/'
tree = lxml.html.parse(url)
img = tree.get_element_by_id('img')
img_url = img.attrib['src']

with open('image.jpg', 'wb') as outf:
    data = requests.get(img_url).content
    outf.write(data)

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X