Si vous connaissez Python, le Boîte à outils en langage naturel (NLTK) possède un lemmatiseur très puissant qui fait usage de WordNet .
Notez que si vous utilisez ce lemmatiseur pour la première fois, vous devez télécharger le corpus avant de l'utiliser. Ceci peut être fait par :
>>> import nltk
>>> nltk.download('wordnet')
Vous ne devez le faire qu'une seule fois. En supposant que vous avez maintenant téléchargé le corpus, cela fonctionne comme suit :
>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lmtzr = WordNetLemmatizer()
>>> lmtzr.lemmatize('cars')
'car'
>>> lmtzr.lemmatize('feet')
'foot'
>>> lmtzr.lemmatize('people')
'people'
>>> lmtzr.lemmatize('fantasized','v')
'fantasize'
Il existe d'autres lemmatiseurs dans la gamme module nltk.stem mais je ne les ai pas essayés moi-même.
28 votes
Ce ne serait pas plutôt les cactus ?
3 votes
Juste pour faire une référence circulaire à la question originale postée sur Reddit : Comment faire par programme pour faire de la symétrie ? (par exemple, "manger" en "manger", "cactus" en "cactus") Je le publie ici parce que les commentaires contiennent des informations utiles.
1 votes
Véase stackoverflow.com/questions/17317418/stemmers-vs-lemmatizers