Au cours des trois dernières années, j'ai utilisé de la R quotidienne, et la plus grande partie de l'utilisation quotidienne est consacré à l'Apprentissage de la Machine/de l'Exploration de Données des problèmes.
J'ai été une exclusivité de Matlab d'un utilisateur dans l'Université; à l'époque je pensais que c'était
un excellent jeu de plate-forme. Je suis sûr qu'il est aujourd'hui.
Le Réseau de Neurones boîte à outils, l'Optimisation de la boîte à outils, boîte à outils de Statistiques,
et l'ajustement de la Courbe des outils sont chaque hautement souhaitable (si pas indispensable)
pour quelqu'un à l'aide de MATLAB pour ML/Data Mining, pourtant, ils sont tous séparés de
la base de MATLAB environnement--en d'autres termes, ils doivent être achetés séparément.
Mon Top 5 pour l'Apprentissage ML/l'Exploration de Données dans R:
Cela se réfère à deux choses: tout d'Abord, un groupe de Package R que tout commence arules (disponible à partir de CRAN); vous pouvez trouver la liste complète (arules, aruluesViz, etc.) sur la page d'Accueil du Projet. D'autre part, tous ces forfaits sont basés sur une extraction des données de la technique connue sous le nom de Marché Baignait Analyse et alternativement comme des Règles d'Association. À de nombreux égards, cette famille d'algorithmes est l'essence même de l'extraction de données--exhaustive de traverser de grandes bases de données de transaction et de trouver au-dessus de la moyenne des associations ou des corrélations entre les champs (variables ou de fonctions) dans ces bases de données. Dans la pratique, vous vous connectez à une source de données et de les laisser tourner toute la nuit. Le centre de R Package dans le jeu mentionné ci-dessus est appelé arules; Sur le CRAN page Package pour arules, vous trouverez des liens vers quelques excellentes sources secondaires (des vignettes dans la R du lexique) sur la arules paquet et sur les Règles d'Association technique en général.
L'édition la plus récente de ce livre est disponible sous forme numérique pour gratuit. De même, le livre du site web (lien juste au-dessus) sont tous les ensembles de données utilisés dans l'ESL, disponible en téléchargement gratuit. (En aparté, j'ai le gratuitement en version numérique; j'ai aussi acheté la version cartonnée de BN.com toutes les couleurs des parcelles de la version numérique sont reproduits dans la version reliée.) ESL contient approfondie des introductions à au moins un exemplaire de la plupart des grandes
ML rubriques--par exemple, de neurones metworks, SVM, KNN; non supervisée
techniques (LDA, le PCA, le MDS, SOM, clustering), de nombreuses saveurs de régression, PANIER,
Bayésien techniques, ainsi que le modèle d'agrégation des techniques (Stimuler, Ensachage)
et le modèle de paramétrage (régularisation). Enfin, obtenir le Package R qui accompagne le livre de CRAN (ce qui permettra d'économiser la peine d'avoir à télécharger l'entrée de la base de données).
- CRAN Tâche de Vue: l'Apprentissage de la Machine
Les +de 3 500 Paquets disponibles
pour les R sont classés par domaine d'environ 30 forfait les familles ou les 'Vues de Tâche'. L'Apprentissage De La Machine
est l'une de ces familles. L'Apprentissage de la Machine Vue des Tâches contient environ 50
Les Packages. Certains de ces emballages font partie de la distribution principale, y compris e1071
(un immense ML package qui comprend le code du travail pour un certain nombre de
l'habitude ML catégories.)
Avec un accent particulier sur les posts tagged avec l'analyse Prédictive
-
ML R tutoriel composé d'une série de diapositives et R code par Josh Reich
Une étude approfondie du code ne serait pas, par elle-même, être une excellente introduction à la ML dans R.
Et une dernière ressource qui je pense est excellent, mais n'a pas fait dans le top 5:
posté sur le blog Un Beau WWW