5 votes

Extraction de données de tableaux à l'aide de Selenium et de Python dans un cadre de données pandas

J'ai donc extrait des données d'une table en utilisant la bibliothèque BeautifulSoup avec le code ci-dessous :

        if soup.find("table", {"class":"a-keyvalue prodDetTable"}) is not None:
        table = parse_table(soup.find("table", {"class":"a-keyvalue prodDetTable"}))
        df = pd.DataFrame(table)

Cela a donc fonctionné, j'ai obtenu la table et l'ai analysée dans un cadre de données, mais j'essaie de faire quelque chose de similaire sur un autre site Web en utilisant Selenium et voici mon code jusqu'à présent :

driver = webdriver.Chrome()
i = "DCD710S2"
base_url = str("https://www.lowes.com/search?searchTerm=" + str(i))
driver.get(base_url)
table = driver.find_element_by_xpath("//*[@id='collapseSpecs']/div/div/div[1]/table/tbody")

J'arrive donc à la table et j'ai essayé d'utiliser getAttribute(innerHTML) et d'autres éléments getAttribute mais je ne parviens pas à obtenir la table telle quelle dans pandas. Avez-vous des suggestions sur la façon de gérer cela avec Selenium ?

Voici à quoi ressemble le html : enter image description here

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X