Y a-t-il un moyen de contourner ce qui suit ?
httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
La seule façon de contourner ce problème est de contacter le propriétaire du site (barnesandnoble.com). Je construis un site qui leur apporterait plus de ventes, je ne sais pas pourquoi ils refuseraient l'accès à une certaine profondeur.
J'utilise mechanize et BeautifulSoup sur Python2.6.
en espérant une solution de rechange
0 votes
Il y a probablement des problèmes juridiques si vous envisagez de monétiser, mais si vous ne le faites pas, continuez comme vous voulez. Longue vie à Scroogle.