2 votes

extraire les données du site et les mettre dans un fichier

J'ai eu ce projet où le client a perdu sa base de données, donc je dois regarder dans leur site actuel (live) et récupérer les informations... le problème est qu'il y a trop de données que je dois copier et insérer dans la base de données ce qui prend beaucoup de temps... pourriez-vous suggérer un code qui pourrait m'aider ?

1voto

Paul Points 353

Vous pouvez utiliser la bibliothèque DOMDocument pour php et écrire des scripts automatisés pour récupérer les données après avoir identifié où se trouvent vos informations dans la page en utilisant les balises.
http://www.php.net/manual/en/book.dom.php

La bibliothèque est très robuste et utilise les xpaths.
http://www.w3schools.com/xpath/xpath_examples.asp

0voto

geon Points 2187

Si les pages ont toutes une structure très similaire, vous pouvez essayer d'utiliser des expressions régulières ou un analyseur html (tidy) pour filtrer les données pertinentes.

J'ai fait une chose similaire pour un client qui avait plus de 200 pages de produits écrites à la main avec des images, des titres et du texte. La source semblait avoir été copiée-collée à partir de la dernière page, et avait évolué en plusieurs versions différentes. Cela a bien fonctionné après quelques ajustements.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X