D'accord, il y a de nombreux analyseurs HTML/XML pour Java. Ce que je veux faire va un peu plus loin que simplement savoir comment l'analyser. Je veux filtrer le contenu et le mettre sous une forme adaptée.
Plus précisément, je veux conserver uniquement le texte et les images. Cependant, je veux aussi préserver une partie de la mise en forme du texte, comme : italique, gras, alignement, etc.
Tout cela est parce que j'essaie de mettre en place un convertisseur qui convertit du html vers un format spécifique que j'ai créé moi-même pour mes propres besoins.
Des idées ? Certainement, cela a déjà dû être fait de nombreuses fois auparavant.