Ma bibliothèque, spaCy fournit un analyseur de dépendances très performant.
Installation :
pip install spacy
python -m spacy.en.download all
Utilisation :
from spacy.en import English
nlp = English()
doc = nlp(u'A whole document.\nNo preprocessing require. Robust to arbitrary formating.')
for sent in doc:
for token in sent:
if token.is_alpha:
print token.orth_, token.tag_, token.head.lemma_
Choi et al (2015) a trouvé que spaCy était l'analyseur de dépendances le plus rapide disponible. Il traite plus de 13 000 phrases par seconde, sur un seul thread. Sur l'évaluation standard du WSJ, il obtient un score de 92,7 %, soit une précision supérieure de plus de 1 % à celle de tous les modèles de CoreNLP.