Conformément à la RFC 1738:
Dangereux:
Les caractères peuvent être dangereux pour un certain nombre de raisons. L'espace
personnage est dangereux parce que d'importants espaces peuvent disparaître et
insignifiant espaces peuvent être introduits lors de l'Url sont transcrits ou
typeset ou soumis à un traitement de programmes de traitement de texte.
Les caractères "<" et ">" sont dangereux parce qu'ils sont utilisés comme
délimiteurs autour des Url en texte libre; le guillemet (""") est utilisé pour
délimiter les Url dans certains systèmes. Le caractère "#" est dangereux et doit
toujours être codé car il est utilisé dans le World Wide Web et dans d'autres
les systèmes de délimiter une URL à partir d'un fragment de l'ancre, de l'identificateur qui pourrait
la suivre. Le caractère "%" est dangereux, car il est utilisé pour
les codages des caractères d'autres. Les autres personnages sont dangereux parce que les
les passerelles et autres agents de transport sont connus pour parfois modifier
de tels caractères. Ces caractères sont "{", "}", "|", "\", "^", "~",
"[", "]", et "`".
Tous les caractères non sécurisées doivent toujours être codées à l'intérieur d'une URL. Pour
exemple, le caractère "#" doit être codé dans les Url, même dans
les systèmes qui ne traitent généralement pas avec fragment d'ancrage ou de
les identificateurs, de sorte que si l'URL est copié dans un autre système
ne les utilisez, il ne sera pas nécessaire de changer l'encodage d'URL.