41 votes

TagSoup vs Jsoup vs HTML Parser vs HotSax vs

L'abondance de HTML analyseurs à choisir (et le bâton avec) est ahurissant:

http://java-source.net/open-source/html-parsers

Comment puis-je choisir celui qui correspond le mieux aux exigences suivantes:

  1. Adultes (de moins en moins de bugs que le reste)
  2. Vivre et respirer (c'est à dire d'être maintenu)
  3. Rapide et efficace des ressources (prévu pour fonctionner sur Android)

Basé sur votre expérience, quel analyseur HTML recommanderiez-vous (pour répondre aux exigences ci-dessus) et pourquoi?

39voto

Regex Rookie Points 3070

Eh bien, j'ai trouvé la réponse qui a été donnée par @BalusC sur un autre thread:

  1. Si vous voulez juste utiliser une base de XML outil de la traverser: JTidy.
  2. Si vous aimez l'unité de tester le code HTML: Interface htmlunit
  3. Si vous souhaitez extraire des données spécifiques à partir du HTML: Jsoup

Merci @BalusC.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X