Je dois télécharger plusieurs fichiers via http en Python.
La façon la plus évidente de le faire est d'utiliser urllib2 :
import urllib2
u = urllib2.urlopen('http://server.com/file.html')
localFile = open('file.html', 'w')
localFile.write(u.read())
localFile.close()
Mais je devrai m'occuper des URLs qui sont malveillants d'une certaine manière, comme ceci : http://server.com/!Run.aspx/someoddtext/somemore?id=121&m=pdf
. Lorsqu'il est téléchargé via le navigateur, le fichier porte un nom lisible par l'homme, à savoir . accounts.pdf
.
Existe-t-il un moyen de gérer cela en python, afin que je n'aie pas besoin de connaître les noms de fichiers et de les coder en dur dans mon script ?