1 votes

Téléchargements par caractères génériques avec Python

Comment puis-je télécharger des fichiers à partir d'un site web en utilisant wildacrds en Python ? J'ai un site sur lequel je dois télécharger des fichiers périodiquement. Le problème est que les noms de fichiers changent à chaque fois. Une partie du fichier reste cependant la même. Comment puis-je utiliser un joker pour spécifier la partie inconnue du fichier dans une URL ?

7voto

Greg Hewgill Points 356191

Si le nom du fichier change, il doit toujours y avoir un fichier lien au fichier quelque part (sinon personne ne pourrait jamais deviner le nom du fichier). Une approche typique consiste à obtenir la page HTML qui contient un lien vers le fichier, à la parcourir à la recherche de la cible du lien, puis à envoyer une deuxième requête pour obtenir le fichier que vous recherchez.

Les serveurs Web ne mettent généralement pas en œuvre une fonction "joker" telle que vous la décrivez. Vous devez donc utiliser d'autres techniques.

1voto

Alvin Row Points 2931

Vous pouvez essayer de vous connecter au serveur ftp en utilisant ftplib . Extrait de la documentation python :

from ftplib import FTP
ftp = FTP('ftp.cwi.nl')   # connect to host, default port
ftp.login()               # user anonymous, passwd anonymous@

L'objet ftp possède un dir qui liste le contenu d'un répertoire. Vous pouvez utiliser cette liste pour trouver le nom du fichier que vous voulez.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X