Qu'est-ce qu'une liste de tous les caractères unicode de type crochet (incluant, par exemple : {}[]()<>
) ? Quelle est une bonne façon de rechercher des caractères unicode ?
Réponses
Trop de publicités?L'idée de caractères "en forme de parenthèses" peut être plus ou moins identifiée avec les valeurs de la propriété General Category (gc) Ps (Ponctuation, ouverte) et Pe (Ponctuation, fermée). Cette catégorie contient quelques dizaines de signes de ponctuation appariés, la plupart excluant les guillemets (catégories Pi et Pf).
En programmation, de nombreux langages disposent d'outils permettant de tester la catégorie générale d'un caractère, par ex. \p{Ps}
en Perl.
Si vous n'avez besoin que de quelques listes, vous pouvez utiliser la fonction Catégories de caractères Unicode informations à fileformat.info.
En général, la façon de rechercher des caractères Unicode dépend de ce que vous recherchez et de vos critères. La catégorie générale est un bon point de départ dans de nombreux cas.
http://xahlee.info/comp/unicode_matching_brackets.html
Il s'agit d'un site web excellent et très complet (pour les parenthèses et tout le reste aussi), et il semble qu'ils les affichent tous en utilisant Arial, sans-serif, donc si vous pouvez voir le caractère, alors cela devrait fonctionner avec un bon support de navigateur.
Parce que La réponse de andrewdotn utilise Python 2, voici la version Python 3 :
import re
import unicodedata
for i in range(0x10000):
char = chr(i)
category = unicodedata.category(char)
name = unicodedata.name(char, '')
if ('bracket' in name.lower() or 'paren' in name.lower()
or category in ['Ps', 'Pe']):
print('U+%04x %s %s %c' % (i, category, name, char))
- Réponses précédentes
- Plus de réponses