wget -nd -r -l 2 -A jpg,jpeg,png,gif http://t.co
-
-nd
: pas de répertoires (sauvegarder tous les fichiers dans le répertoire courant; -P directory
change le répertoire cible)
-
-r -l 2
: récursive niveau 2
-
-A
: accepté extensions
wget -nd -H -p -A jpg,jpeg,png,gif -e robots=off example.tumblr.com/page/{1..2}
-
-H
: durée d'hôtes (wget ne pas télécharger des fichiers à partir de différents domaines ou sous-domaines par défaut)
-
-p
: page requis (comprend des ressources comme des images sur chaque page)
-
-e robots=off
: exécuter la commande robotos=off
comme si elle faisait partie de l' .wgetrc
le fichier. Cela désactive l'exclusion des robots qui signifie que vous ignorez robots.txt et le robot meta tags (vous devez connaître les implications que cela vient avec, prendre soin).
Exemple: Obtenir tous .jpg
fichiers à partir d'un exemplaire de la liste de l'annuaire:
$ wget -nd -r -l 1 -A jpg http://example.com/listing/