Cette question connexe de stackoverflow contient des réponses intéressantes : Quels sont les bons points de départ pour une personne intéressée par le traitement du langage naturel ?
Il s'agit d'un domaine très vaste. Les prérequis consistent principalement en probabilités/statistiques, algèbre linéaire et informatique de base, bien que le traitement des langues naturelles nécessite une formation informatique plus intensive au départ (couvrant souvent quelques bases d'IA). En ce qui concerne les langages spécifiques : Lisp a été créé "La recherche sur l'intelligence artificielle n'est qu'un pis-aller tandis que Prolog (qui trouve ses racines dans la logique formelle) est particulièrement destiné au traitement du langage naturel, et de nombreux cours utilisent Prolog, Scheme, Matlab, R, ou un autre langage fonctionnel (par ex. OCaml est utilisé pour ce cours à Cornell ) car ils sont très adaptés à ce type d'analyse.
Voici quelques conseils plus spécifiques :
Pour l'apprentissage automatique, Stanford CS 229 : Apprentissage automatique est excellent : il comprend tout, y compris les vidéos complètes des cours (également disponibles sur iTunes), les notes de cours, les séries de problèmes, etc. Andrew Ng .
Notez les conditions préalables :
Les étudiants doivent posséder les connaissances suivantes : Connaissance des des principes et des compétences de base en informatique, à un niveau suffisant pour écrire un programme informatique raisonnablement non trivial. Familiarité avec la théorie de base des probabilités. Familiarité avec l'algèbre linéaire de base.
Le cours utilise Matlab et/ou Octave. Il recommande également les lectures suivantes (bien que les notes de cours elles-mêmes soient très complètes) :
- Christopher Bishop, Reconnaissance des formes et apprentissage automatique . Springer, 2006.
- Richard Duda, Peter Hart et David Stork, Classification des modèles , 2e éd. John Wiley & Sons, 2001.
- Tom Mitchell, Apprentissage automatique . McGraw-Hill, 1997.
- Richard Sutton et Andrew Barto, Apprentissage par renforcement : Une introduction . MIT Press, 1998
Pour le traitement du langage naturel, le Groupe PNL à Stanford fournit de nombreuses ressources de qualité. Le cours d'introduction Stanford CS 224 : Traitement du langage naturel comprend toutes les conférences en ligne et a les prérequis suivants :
Expérience suffisante en matière de p et des structures formelles. Les projets Les projets de programmation seront écrits en Java 1.5, la connaissance de Java (ou la volonté d'apprendre par soi-même) est donc requise. (ou une volonté d'apprendre par soi-même) est requise. Connaissance des concepts standards en intelligence artificielle et/ou linguistique informatique. Connaissance de base familiarité avec la logique, les espaces vectoriels et les probabilités.
Certains textes sont recommandés :
La condition préalable cours de linguistique informatique nécessite des connaissances de base en programmation informatique et en structures de données, et utilise les mêmes manuels. Le cours d'intelligence artificielle requis est également disponible en ligne ainsi que toutes les notes de cours et les utilisations :
Il s'agit du texte standard sur l'intelligence artificielle, qui mérite également d'être lu.
J'utilise R pour l'apprentissage automatique et je le recommande vivement. Pour cela, je suggérerais de regarder Les éléments de l'apprentissage statistique dont le texte intégral est disponible gratuitement en ligne. Vous pouvez vous référer à la Apprentissage automatique y Traitement du langage naturel sur le CRAN pour des fonctionnalités spécifiques.
0 votes
Une question connexe (sur le sujet) est la suivante datascience.stackexchange.com/questions/36463/