Comment donner un délai entre chaque requête dans scrapy ?

Question

Comment donner un délai entre chaque requête dans scrapy ?

Demandé el 7 de Janvier, 2012: Quand la question a-t-elle été
42130 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Je ne veux pas ramper simultanément et être bloqué. Je voudrais envoyer une requête par seconde.

Demandé el 7 de Janvier, 2012 par nizam.sp

Answer 1

5 Réponses

Answer 2

71voto

warvariuc Points 11787

Il existe un paramètre pour ça :

DOWNLOAD_DELAY

Par défaut : 0

Le temps (en secondes) que le téléchargeur doit attendre avant que avant de télécharger des pages consécutives du même site Web. Cette valeur peut être utilisée pour limiter la vitesse d'exploration et éviter de frapper trop fort les serveurs.

DOWNLOAD_DELAY = 0.25    # 250 ms of delay

Lisez la documentation : https://doc.scrapy.org/en/latest/index.html

Répondu el 7 de Janvier, 2012 par warvariuc (11787 Points )

Answer 3

19voto

Mikhail Korobov Points 6225

Vous pouvez également définir l'attribut "download_delay" sur l'araignée si vous ne souhaitez pas un délai de téléchargement global. Voir http://doc.scrapy.org/en/latest/faq.html#what-does-the-response-status-code-999-means

Répondu el 3 de Juin, 2013 par Mikhail Korobov (6225 Points )

Answer 4

10voto

Yan.Zero Points 22

class S(Spider):
    rate = 1

    def __init__(self):
        self.download_delay = 1/float(self.rate)

taux fixe un nombre maximum de pages pouvant être téléchargées en une seconde.

Répondu el 20 de Août, 2014 par Yan.Zero (22 Points )

Answer 5

8voto

Mehmet Kurtipek Points 113

En plus de DOWNLOAD_DELAY, vous pouvez également utiliser la fonction AUTOTHROTTLE de scrapy, https://doc.scrapy.org/en/latest/topics/autothrottle.html

Il modifie le délai entre les requêtes en fonction du fichier de configuration. Si vous définissez 1 pour le délai de départ et le délai maximal, il attendra 1 seconde à chaque demande.

Son but initial est de faire varier le temps de retard pour que la détection de votre robot soit plus difficile.

Il vous suffit de le définir dans settings.py comme suit :

AUTOTHROTTLE_ENABLED = True
AUTOTHROTTLE_START_DELAY = 1
AUTOTHROTTLE_MAX_DELAY = 3

Répondu el 19 de Janvier, 2017 par Mehmet Kurtipek (113 Points )

Answer 6

7voto

Niranjan Sagar Points 769

Délais Peut-on mettre en 2 dit:-

Nous pouvons spécifier le délai lors de l'exécution du crawler. Par exemple, scrapy crawl sample --set DOWNLOAD_DELAY=3 (ce qui signifie un délai de 3 secondes entre deux requêtes).

Ou bien nous pouvons spécifier Globaly dans le settings.py DOWNLOAD_DELAY = 3

par défaut scrapy prend 0.25 secondes de délai entre 2 requêtes.

Répondu el 14 de Octobre, 2015 par Niranjan Sagar (769 Points )

Comment donner un délai entre chaque requête dans scrapy ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment donner un délai entre chaque requête dans scrapy ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: