Je suis en train d'utiliser Beautiful Soup en Python.
Voici un exemple d'URL :
http://www.locationary.com/place/en/US/Ohio/Middletown/McDonald%27s-p1013254580.jsp
Dans le HTML, il y a toute une série de balises et la seule façon que j'ai de spécifier celles à trouver est avec leur id. La seule chose que je veux trouver est le numéro de téléphone. La balise ressemble à ceci :
5134231582
Je suis allé sur d'autres URL sur le même site web et j'ai trouvé presque le même id pour la balise du numéro de téléphone à chaque fois. La partie qui reste toujours la même est :
'value_xxx_c_1_f_8_a_'
Cependant, les chiffres qui suivent cela changent toujours. Y a-t-il un moyen de dire à Beautiful Soup de chercher une partie de l'id et de la faire correspondre tout en laissant l'autre partie être des chiffres comme le ferait une expression régulière?
Aussi, une fois que j'ai la balise, je me demandais... comment puis-je extraire le numéro de téléphone sans utiliser d'expressions régulières? Je ne sais pas si Beautiful Soup peut le faire mais ce serait probablement plus simple que les regex.