arriver Interdit par robots.txt: scrapy

Question

arriver Interdit par robots.txt: scrapy

Demandé el 17 de Mai, 2016: Quand la question a-t-elle été
19365 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

lors de l'exploration des sites web tels que https://www.netflix.com, obtenir Interdite par robots.txt: https://www.netflix.com/>

ERREUR: Pas de réponse téléchargé: https://www.netflix.com/

Demandé el 17 de Mai, 2016 par deepak kumar

Answer 1

2 Réponses

Answer 2

186voto

Rafael Almeida Points 3228

Dans la nouvelle version (scrapy 1.1) a lancé 2016-05-11 l'analyse de la première téléchargements robots.txt avant de ramper. Pour modifier ce changement de comportement dans votre settings.py avec ROBOTSTXT_OBEY

ROBOTSTXT_OBEY=False

Voici les notes de version

Répondu el 17 de Mai, 2016 par Rafael Almeida (3228 Points )

Answer 3

2voto

Ketan Patel Points 21

Première chose que vous devez vous assurer que vous changiez votre agent utilisateur dans la requête, sinon par défaut de l'agent utilisateur sera bloqué pour sûr.

Répondu el 17 de Mai, 2016 par Ketan Patel (21 Points )

arriver Interdit par robots.txt: scrapy

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

arriver Interdit par robots.txt: scrapy

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: