J'ai eu ce projet où le client a perdu sa base de données, donc je dois regarder dans leur site actuel (live) et récupérer les informations... le problème est qu'il y a trop de données que je dois copier et insérer dans la base de données ce qui prend beaucoup de temps... pourriez-vous suggérer un code qui pourrait m'aider ?
Réponses
Trop de publicités?Vous pouvez utiliser la bibliothèque DOMDocument pour php et écrire des scripts automatisés pour récupérer les données après avoir identifié où se trouvent vos informations dans la page en utilisant les balises.
http://www.php.net/manual/en/book.dom.php
La bibliothèque est très robuste et utilise les xpaths.
http://www.w3schools.com/xpath/xpath_examples.asp
Si les pages ont toutes une structure très similaire, vous pouvez essayer d'utiliser des expressions régulières ou un analyseur html (tidy) pour filtrer les données pertinentes.
J'ai fait une chose similaire pour un client qui avait plus de 200 pages de produits écrites à la main avec des images, des titres et du texte. La source semblait avoir été copiée-collée à partir de la dernière page, et avait évolué en plusieurs versions différentes. Cela a bien fonctionné après quelques ajustements.