Web-scraping JavaScript page avec Python

Question

Web-scraping JavaScript page avec Python

Demandé el 8 de Novembre, 2011: Quand la question a-t-elle été
395190 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

J'essaie de développer un simple grattoir web. Je veux extraire du texte sans le code HTML. Il fonctionne sur HTML simple, mais pas dans certaines pages où le code JavaScript ajoute du texte.

Par exemple, si du code JavaScript ajoute du texte, je ne peux pas le voir, parce que lorsque j'appelle :

response = urllib2.urlopen(request)

Je reçois le texte original sans celui ajouté (car JavaScript est exécuté dans le client).

Donc, je cherche des idées pour résoudre ce problème.

Demandé el 8 de Novembre, 2011 par mocopera

Answer 1

1 Réponses

Answer 2

64voto

amazingthere Points 558

Peut-être que le sélénium peut le faire.

from selenium import webdriver
import time

driver = webdriver.Firefox()
driver.get(url)
time.sleep(5)
htmlSource = driver.page_source

Répondu el 14 de Avril, 2016 par amazingthere (558 Points )

Web-scraping JavaScript page avec Python

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Web-scraping JavaScript page avec Python

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: