D'après la documentation python sur expressions rationnelles concernant les '\'
caractère :
La solution consiste à utiliser le logiciel Python Les barres obliques inverses ne sont pas gérées de manière particulière dans un littéral de chaîne préfixé par
'r'
. Ainsir"\n"
est une chaîne de deux caractères contenant'\'
y'n'
, tandis que"\n"
i contenant une nouvelle ligne. En général, les motifs sont exprimés en code Python en utilisant cette notation de chaîne brute.
Qu'est-ce que la notation brute des chaînes de caractères ? Si vous utilisez un format de chaîne brute, cela signifie-t-il que "*"
est considéré comme un caractère littéral plutôt que comme un indicateur zéro ou plus ? Ce n'est évidemment pas possible, sinon la regex perdrait toute sa puissance. Mais alors, s'il s'agit d'une chaîne de caractères brute, comment reconnaît-elle les caractères de retour à la ligne si "\n"
est littéralement une barre oblique inverse et un "n"
?
Je ne suis pas.
Modifier pour la prime :
J'essaie de comprendre comment une regex de chaîne brute correspond aux nouvelles lignes, aux tabulations et aux jeux de caractères, par exemple. \w
pour les mots ou \d
pour les chiffres ou autres, si les modèles de chaînes brutes ne reconnaissent pas les barres obliques inverses comme étant plus que des caractères ordinaires. J'aurais vraiment besoin de bons exemples.