Comment puis-je télécharger des fichiers à partir d'un site web en utilisant wildacrds en Python ? J'ai un site sur lequel je dois télécharger des fichiers périodiquement. Le problème est que les noms de fichiers changent à chaque fois. Une partie du fichier reste cependant la même. Comment puis-je utiliser un joker pour spécifier la partie inconnue du fichier dans une URL ?
Réponses
Trop de publicités?Si le nom du fichier change, il doit toujours y avoir un fichier lien au fichier quelque part (sinon personne ne pourrait jamais deviner le nom du fichier). Une approche typique consiste à obtenir la page HTML qui contient un lien vers le fichier, à la parcourir à la recherche de la cible du lien, puis à envoyer une deuxième requête pour obtenir le fichier que vous recherchez.
Les serveurs Web ne mettent généralement pas en œuvre une fonction "joker" telle que vous la décrivez. Vous devez donc utiliser d'autres techniques.
Vous pouvez essayer de vous connecter au serveur ftp en utilisant ftplib . Extrait de la documentation python :
from ftplib import FTP
ftp = FTP('ftp.cwi.nl') # connect to host, default port
ftp.login() # user anonymous, passwd anonymous@
L'objet ftp possède un dir
qui liste le contenu d'un répertoire. Vous pouvez utiliser cette liste pour trouver le nom du fichier que vous voulez.