Il s'agit de séquences d'échappement Unicode qui font référence à des caractères de l'ensemble de caractères Unicode en indiquant leurs points de code en hexadécimal.
D'après la spécification JSON:
N'importe quel caractère peut être échappé. Si le caractère se trouve dans le Plan Multilingue de Base (U+0000 à U+FFFF), alors il peut être représenté par une séquence de six caractères : un caractère barre oblique inversée, suivi de la lettre minuscule u
, suivi de quatre chiffres hexadécimaux qui codent le point de code du caractère. Les lettres hexadécimales A
à F
peuvent être en majuscules ou en minuscules. Ainsi, par exemple, une chaîne contenant uniquement un caractère barre oblique inversée peut être représentée comme "\u005C
".
Bien que ces caractères n'aient pas besoin d'être échappés (voir la règle non échappée), json_encode
encode tout caractère sauf ceux qui sont également en US-ASCII (voir la source de json.c) pour éviter les problèmes d'encodage avec les protocoles basés sur US-ASCII.
Ainsi, à l'intérieur d'une chaîne JSON, \u0435
fait référence au caractère à U+0435 qui est le PETITE LETTRE CYRILLIQUE IE (е
) et \u0434
fait référence au caractère à U+0434 qui est la PETITE LETTRE CYRILLIQUE DE (д
).