58 votes

HtmlAgilityPack et HtmlDecode

J'utilise actuellement HtmlAgilityPack avec une application console pour gratter un site Web. Le code HTML étant codé (il renvoie des caractères codés tels que ' ), je dois le décoder avant de sauvegarder le contenu dans ma base de données.

Existe-t-il un moyen de décoder le code HTML renvoyé à l'aide de HtmlAgilityPack sans avoir à utiliser HttpUtility.HtmlDecode? Je souhaite éviter d'ajouter System.Web à mon application console si possible.

111voto

Simon Mourier Points 49585

Html Agility Pack est équipé d’une classe d’utilitaires appelée HtmlEntity . Il a une méthode statique avec la signature suivante:

     /// <summary>
    /// Replace known entities by characters.
    /// </summary>
    /// <param name="text">The source text.</param>
    /// <returns>The result text.</returns>
    public static string DeEntitize(string text)
 

Il prend également en charge des entités connues (telles que &nbsp; ) et des caractères codés tels que &#039; .

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X