Le codage HTML empêchera-t-il tous les types d'attaques XSS ?

Question

Le codage HTML empêchera-t-il tous les types d'attaques XSS ?

Demandé el 10 de Septembre, 2008: Quand la question a-t-elle été
17215 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je ne suis pas préoccupé par d'autres types d'attaques. Je veux juste savoir si HTML Encode peut prévenir tous les types d'attaques XSS.

Existe-t-il un moyen d'effectuer une attaque XSS même si HTML Encode est utilisé ?

Demandé el 10 de Septembre, 2008 par Niyaz

Answer 1

5 Réponses

Answer 2

93voto

AviD Points 8413

Non.

Si l'on met de côté la question de l'autorisation de certaines balises (qui n'est pas vraiment l'objet de la question), HtmlEncode ne couvre tout simplement PAS toutes les attaques XSS.

Prenons l'exemple du javascript côté client généré par le serveur - le serveur produit dynamiquement des valeurs codées en html directement dans le javascript côté client, htmlencode va ne pas s'arrêter a empêché l'exécution du script injecté.

Considérons ensuite le pseudocode suivant :

<input value=<%= HtmlEncode(somevar) %> id=textbox>

Maintenant, au cas où cela ne serait pas immédiatement évident, si somevar (envoyé par l'utilisateur, bien sûr) est fixé par exemple à

a onclick=alert(document.cookie)

le résultat obtenu est le suivant

<input value=a onclick=alert(document.cookie) id=textbox>

qui fonctionnerait manifestement. Évidemment, il peut s'agir de (presque) n'importe quel autre script... et HtmlEncode ne serait pas d'une grande aide.

Il y a quelques vecteurs supplémentaires à prendre en compte... y compris le troisième type de XSS, appelé DOM-based XSS (dans lequel le script malveillant est généré dynamiquement sur le client, par exemple sur la base des valeurs #).

N'oubliez pas non plus les attaques de type UTF-7 - où l'attaque ressemble à

+ADw-script+AD4-alert(document.cookie)+ADw-/script+AD4-

Il n'y a pas grand-chose à encoder ici...

La solution, bien sûr (en plus d'une validation appropriée et restrictive des entrées en liste blanche), consiste à effectuer les opérations suivantes sensible au contexte encodage : HtmlEncoding est excellent SI le contexte de sortie est HTML, ou peut-être avez-vous besoin de JavaScriptEncoding, ou VBScriptEncoding, ou AttributeValueEncoding, ou... etc.

Si vous utilisez MS ASP.NET, vous pouvez utiliser leur bibliothèque Anti-XSS, qui fournit toutes les méthodes de codage contextuel nécessaires.

Notez que tous les encodages ne doivent pas être limités à la saisie de l'utilisateur, mais également aux valeurs stockées dans la base de données, aux fichiers texte, etc.

Oh, et n'oubliez pas de définir explicitement le charset, à la fois dans l'en-tête HTTP ET dans la balise META, sinon vous aurez toujours des vulnérabilités UTF-7...

Pour plus d'informations et une liste définitive (constamment mise à jour), consultez l'aide-mémoire de RSnake : http://ha.ckers.org/xss.html

Répondu el 16 de Septembre, 2008 par AviD (8413 Points )

1 votes

Il est évidemment erroné d'écrire <input value=<%= HtmlEncode(somevar) %> id=textbox> et non <input value="<%= HtmlEncode(somevar)" %> id=textbox> si vous ne savez pas si le texte contient, par exemple, un blanc.

Commenté el 18 de Septembre, 2008 par Erik

1 votes

C'est exactement le problème - HTMLEncode ne vous protège pas contre les erreurs. Bien sûr, le programmeur s'attendait à ce que somevar contienne 23 - c'est juste ce méchant attaquant qui a décidé d'insérer un blanc...

Commenté el 18 de Septembre, 2008 par AviD

0 votes

Il ne servirait à rien de l'entourer, image que SOMEVAR inclut ce texte | " onclick="alert() ;" " | il s'affichera alors comme une balise valide.

Commenté el 19 de Septembre, 2008 par Espo

Afficher 3 autres commentaires

Answer 3

9voto

Pat Points 18943

Si vous encodez systématiquement toutes les données saisies par l'utilisateur avant de les afficher ~~alors oui, vous êtes en sécurité~~ vous n'êtes toujours pas en sécurité à 100 %.
(Voir le billet de @Avid pour plus de détails)

En outre, des problèmes se posent lorsqu'il s'agit de laisser certains ne sont pas codées, ce qui permet aux utilisateurs d'afficher des images, du texte en gras ou toute autre fonction nécessitant que les données de l'utilisateur soient traitées (ou converties) en balises non codées.

Vous devrez mettre en place un système de prise de décision pour déterminer quelles balises sont autorisées et lesquelles ne le sont pas, et il est toujours possible que quelqu'un trouve un moyen de laisser passer une balise non autorisée.

Il est utile de suivre les conseils de Joel, à savoir Faire passer un code erroné pour un code erroné ou si votre langue vous aide en avertissant ou en ne compilant pas lorsque vous produisez des données utilisateur non traitées (typage statique).

Répondu el 10 de Septembre, 2008 par Pat (18943 Points )

0 votes

Bien qu'il s'agisse d'un bon point concernant le contournement de certaines balises, la réponse à la question est erronée. Voir ma réponse...

Commenté el 18 de Septembre, 2008 par AviD

0 votes

J'ai ajouté un commentaire à l'OP pour qu'il accepte votre réponse à la place. Et j'ai ajouté un lien dans mon message vers votre réponse, juste au cas où.

Commenté el 19 de Septembre, 2008 par Pat

Answer 4

3voto

Mendelt Points 21583

Si vous encodez tout, il le fera. (en fonction de votre plateforme et de l'implémentation de htmlencode) Mais toute application web utile est si complexe qu'il est facile d'oublier d'en vérifier chaque partie. Ou peut-être qu'un composant tiers n'est pas sûr. Ou peut-être qu'un chemin de code que vous pensiez faire de l'encodage ne l'a pas fait et que vous l'avez oublié ailleurs.

Il peut donc être utile de vérifier les choses du côté de l'entrée. Et vous pourriez vouloir vérifier les choses que vous lisez dans la base de données.

Répondu el 10 de Septembre, 2008 par Mendelt (21583 Points )

Answer 5

1voto

metavida Points 911

Comme tous les autres l'ont mentionné, vous êtes en sécurité tant que vous encodez todos de l'utilisateur avant de l'afficher. Cela inclut tous les paramètres de la requête et les données extraites de la base de données qui peuvent être modifiées par l'utilisateur.

En tant que mentionné par Pat vous voudrez parfois afficher certaines balises, mais pas toutes. Une façon courante de le faire est d'utiliser un langage de balisage tel que Textile , Markdown ou BBCode . Cependant, même les langages de balisage peuvent être vulnérables aux XSS, il faut en être conscient.

# Markup example
[foo](javascript:alert\('bar'\);)

Si vous décidez de laisser passer les balises "sûres", je vous recommande de trouver une bibliothèque existante pour analyser et assainir votre code avant la sortie. Il existe beaucoup de vecteurs XSS qu'il faudrait détecter pour que votre désinfectant soit relativement sûr.

Répondu el 10 de Septembre, 2008 par metavida (911 Points )

Answer 6

1voto

tqbf Points 6629

Je partage le conseil de metavida de trouver une bibliothèque tierce pour gérer le filtrage de sortie. Neutraliser les caractères HTML est une bonne approche pour stopper les attaques XSS. Cependant, le code que vous utilisez pour transformer les métacaractères peut être vulnérable aux attaques d'évasion ; par exemple, s'il ne gère pas correctement l'Unicode et l'internationalisation.

Une erreur classique et simple commise par les filtres de sortie maison est de n'attraper que < et >, mais d'omettre des choses comme ", qui peuvent interrompre la sortie contrôlée par l'utilisateur dans l'espace d'attribut d'une balise HTML, où le Javascript peut être attaché au DOM.

Répondu el 11 de Septembre, 2008 par tqbf (6629 Points )

Le codage HTML empêchera-t-il tous les types d'attaques XSS ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Le codage HTML empêchera-t-il tous les types d'attaques XSS ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: