Je ne parviens pas à trouver un bon site Web en grattant une API basée sur Java. Le site que je dois gratter ne fournit pas non plus d’API; Je souhaite parcourir toutes les pages Web en utilisant un identifiant de page et extraire les titres HTML / autres éléments de leurs arborescences DOM.
Existe-t-il d'autres moyens que le raclage Web?
Merci