Quelles bibliothèques utilisez-vous pour l'apprentissage automatique en C/C++, Python, Java ?
Réponses
Trop de publicités?En rapport avec Python :
Orange : cadre d'exploration des données
NLTK : traitement du langage naturel et analyse de texte
Gensim : Modélisation de l'espace vectoriel
L'apprentissage automatique : Une perspective algorithmique : Bien qu'il s'agisse d'un livre, nous pouvons toucher directement le code source.
NumPy/SciPy connexes
Bibliothèque d'apprentissage automatique liée à Python
Si vous avez vraiment besoin d'une tonne de paquets d'apprentissage automatique à réviser. MayBe http://mloss.org/software/ est l'endroit.
Pour Python :
-
PDM est une bibliothèque de traitement du signal, qui vous permet de construire facilement des pipelines d'algorithmes
-
scikits.learn est une collection d'algorithmes d'apprentissage automatique qui se développe rapidement.
Weka (en Java) est certainement l'un des plus populaires, et a été exposé à la plupart des autres (y compris Python).
Pour le C++, je recommande de regarder Requin pero Shogun est également très bon. (voir, également, ce question relative au SO) .
Je trouve Apache Mahout une excellente option pour construire des applications basées sur l'apprentissage automatique. Il prend en charge regroupement, classification et filtrage collaboratif par lots en utilisant un certain nombre d'algorithmes standard. Apache Mahout en action est un bon livre pour s'initier à l'apprentissage automatique et se familiariser avec les éléments suivants clustering, recommandations, classification algorithmes en utilisant la bibliothèque Mahout.
L'avantage de cette bibliothèque est qu'elle est hautement évolutive et que les exemples fournis dans la version donnent un aperçu utile de son utilisation pour créer des applications à part entière. Il s'agit de exploite les capacités d'Apache Hadoop et de Map Reduce. afin de mettre à l'échelle les ensembles de données sur lesquels les différents algorithmes sont exécutés et d'obtenir de grands résultats. les performances en faisant du calcul distribué .