Il n'y a que quelques bibliothèques ML que j'ai suffisamment utilisées pour pouvoir les recommander ; dlib ml est certainement l'un d'entre eux.
Téléchargement de Sourceforge ici ; et le contrôle des bords perdus :
hg clone http://hg.code.sf.net/p/dclib/code dclib-code
Le créateur original de la bibliothèque et son responsable actuel est Davis King.
Votre liste de souhaits par rapport aux fonctionnalités pertinentes de dlib :
-
bonne documentation Pour les bibliothèques gratuites et à code source ouvert destinées à un groupe relativement restreint d'utilisateurs/développeurs, c'est probablement la meilleure solution possible. Introduction à dlib , un (faible trafic) forum et un grand nombre d'excellents exemples (dont au moins un pour le SVM).
-
C++ : 100% en C++ pour autant que je sache.
-
Support-Vecteur Machine algorithme : oui ; en fait, les modules SVM ont fait l'objet des plus récentes mises à jour de cette bibliothèque.
-
Clustering hiérarchique algorithme : non disponible dans la boîte. Cependant, il existe un code packagé pour clustering k-means . Il est évident que les résultats de chaque technique sont très différents, mais le calcul de la métrique de similarité et l'étape ultérieure de l'étape de partitionnement récursif/itératif qui suit sont sont au cœur de chacune d'entre elles. Autrement dit, le moteur de calcul du clustering hiérarchique est là. L'adaptation du module de clustering existant pour HC nécessitera plus que quelques lignes de code, mais il sera possible d'adapter le module de clustering aux besoins de l'utilisateur. quelques lignes de code, mais ce n'est pas non plus pas un effort majeur étant donné que vous travaillez presque au niveau de la niveau de présentation des données.
dlib ml a quelques points supplémentaires pour le recommander. Il s'agit d'une bibliothèque mature (elle en est à la version 17.x maintenant, la version 1.x a été publiée à la fin de 2005, je crois), mais elle reste également en développement actif, comme en témoignent les journaux du dépôt (la dernière mise à jour, 17.27, date du 17 mai 2010) et le dernier commit (23 mai 2010). En outre, il inclut également un certain nombre d'autres techniques ML (par exemple, les réseaux bayésiens, les méthodes à noyau, etc.) Et troisièmement, dllib ml a d'excellentes bibliothèques de "support" pour le calcul matriciel et l'optimisation, qui sont tous deux des éléments fondamentaux de nombreuses techniques ML.
Dans les sources, j'ai remarqué que dlib ml est sous licence de BSL (Boost ?), qui est une licence open source, bien que je ne sache rien d'autre sur ce type de licence.