142 votes

Comment pour utiliser Wget pour télécharger toutes les Images dans un seul dossier

Je suis à l'aide de wget pour télécharger toutes les images d'un site web et il fonctionne très bien mais il stocke l'original de la hiérarchie du site avec tous les sous-dossiers et de sorte que les images sont éparpillés autour. Est-il possible alors qu'il vient de télécharger toutes les images dans un dossier unique? La syntaxe que j'utilise en ce moment est:

wget -r -A jpeg,jpg,bmp,gif,png http://www.domain.com

210voto

Jon Points 1680

Essayez ceci:

wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://www.domain.com

Plus d'informations:

-r permet récursive de la récupération. Voir Récursive de Téléchargement pour plus d'informations.

-P définit le préfixe de répertoire où tous les fichiers et répertoires sont enregistrés.

-A définit une liste blanche pour la récupération de certains types de fichiers. Les cordes et les modèles sont acceptés, et les deux peuvent être utilisés dans une liste séparée par des virgules (comme vu ci-dessus). Voir les Types de Fichiers pour plus d'informations.

132voto

Lri Points 8342
wget -nd -r -l 2 -A jpg,jpeg,png,gif http://t.co
  • -nd: pas de répertoires (sauvegarder tous les fichiers dans le répertoire courant; -P directory change le répertoire cible)
  • -r -l 2: récursive niveau 2
  • -A: accepté extensions
wget -nd -H -p -A jpg,jpeg,png,gif -e robots=off example.tumblr.com/page/{1..2}
  • -H: durée d'hôtes (wget ne pas télécharger des fichiers à partir de différents domaines ou sous-domaines par défaut)
  • -p: page requis (comprend des ressources comme des images sur chaque page)
  • -e robots=off: exécuter la commande robotos=off comme si elle faisait partie de l' .wgetrc le fichier. Cela désactive l'exclusion des robots qui signifie que vous ignorez robots.txt et le robot meta tags (vous devez connaître les implications que cela vient avec, prendre soin).

Exemple: Obtenir tous .jpg fichiers à partir d'un exemplaire de la liste de l'annuaire:

$ wget -nd -r -l 1 -A jpg http://example.com/listing/

15voto

ezy Points 71

J'ai écrit un shell script qui permet de résoudre ce problème pour plusieurs sites web: https://github.com/eduardschaeli/wget-image-scraper

(Éraflures des images à partir d'une liste d'url avec wget)

9voto

emab Points 676

Essayez celui-ci:

`wget -nd -r -P /save/location/ -A jpeg,jpg,bmp,gif,png http://www.domain.com`

et attendre jusqu'à ce qu'il supprime toutes les informations supplémentaires

5voto

yagudaev Points 1286

Selon la page de man de l'option-P est:

P-préfixe --directory-prefix=prefix Définir le répertoire préfixe préfixe. Le répertoire préfixe est le répertoire où tous les autres fichiers et sous-répertoires seront sauvés pour, c'est à dire le haut de la récupération de l'arbre. La valeur par défaut est . (le répertoire courant).

Cela signifie qu'il ne spécifie la destination, mais où sauvegarder l'arborescence de répertoire. Il n'a pas d'aplatir l'arbre dans un seul répertoire. Comme mentionné précédemment, l'-nd drapeau ne fait que.

@Jon dans l'avenir, il serait bénéfique pour décrire ce que le drapeau ne nous avons donc comprendre comment quelque chose fonctionne.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X