Je suis en train de m'initier au scraping et j'ai constaté que parfois les URL que j'introduis dans mon code renvoient 404, ce qui gomme tout le reste de mon code.
J'ai donc besoin d'un test en haut du code pour vérifier si l'URL renvoie 404 ou non.
Cela semble être une tâche assez simple, mais Google ne me donne aucune réponse. J'ai peur de chercher les mauvaises choses.
Un blog m'a recommandé d'utiliser ceci :
$valid = @fsockopen($url, 80, $errno, $errstr, 30);
et ensuite tester pour voir si $valid est vide ou non.
Mais je pense que l'URL qui me pose problème a une redirection, donc $valid est vide pour toutes les valeurs. Ou peut-être que je fais quelque chose d'autre de mal.
J'ai également cherché une "demande principale", mais je n'ai pas encore trouvé d'exemples concrets de code avec lesquels je puisse jouer ou que je puisse essayer.
Des suggestions ? Et c'est quoi cette histoire de boucles ?