Tous les détails sanglants peuvent être trouvés dans le RFC actuel sur le sujet : RFC 3986 (Uniform Resource Identifier (URI) : Generic Syntax)
Sur la base de cette réponse connexe vous avez devant vous une liste qui ressemble à ceci : A-Z
, a-z
, 0-9
, -
, .
, _
, ~
, :
, /
, ?
, #
, [
, ]
, @
, !
, $
, &
, '
, (
, )
, *
, +
, ,
, ;
, %
y =
. Tout le reste doit être url-encodé . En outre, certains de ces caractères ne peuvent exister qu'à des endroits très spécifiques dans un URI et, en dehors de ces endroits, ils doivent être codés en url (par exemple, le code de l'url). %
ne peut être utilisé qu'en conjonction avec l'encodage url, comme dans l'exemple suivant %20
), le RFC contient toutes ces spécificités.
5 votes
Avez-vous regardé le RFC ? faqs.org/rfcs/rfc1738.html
0 votes
Il y a ce qui est techniquement une URL valide et ce qui est réellement utilisé comme URL aujourd'hui. Seulement 25% de l'internet est écrit en anglais. #Les langues n°2 et n°4 sont le chinois et l'arabe. Cette réponse à une autre question résume bien la situation : stackoverflow.com/a/36667242/1128668