Je dois analyser (côté serveur) de grandes quantités de pages HTML.
Nous sommes tous d'accord pour dire que les expressions génériques ne sont pas la solution.
Il me semble que le javascript est le moyen natif d'analyser une page HTML, mais cette hypothèse repose sur le fait que le code côté serveur dispose de toutes les capacités DOM du javascript à l'intérieur d'un navigateur.
Node.js a-t-il cette capacité intégrée ?
Existe-t-il une meilleure approche de ce problème, en analysant le code HTML du côté du serveur ?