Enregistrer NaiveBayes classificateur à disque en Scikits apprendre

Question

Enregistrer NaiveBayes classificateur à disque en Scikits apprendre

Demandé el 15 de Mai, 2012: Quand la question a-t-elle été
6580 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Comment puis-je enregistrer une formation de classificateur de Bayes Naïf de disque et de les utiliser pour prédire les données?

J'ai l'exemple de programme suivant de Scikits apprendre site web:

from sklearn import datasets
iris = datasets.load_iris()
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)
print "Number of mislabeled points : %d" % (iris.target != y_pred).sum()

Demandé el 15 de Mai, 2012 par garak

Answer 1

2 Réponses

Answer 2

232voto

mwv Points 621

Les classificateurs sont juste des objets qui peuvent être traitées et jetés comme toutes les autres. Pour continuer votre exemple:

import cPickle
# save the classifier
with open('my_dumped_classifier.pkl', 'wb') as fid:
    cPickle.dump(gnb, fid)    

# load it again
with open('my_dumped_classifier.pkl', 'rb') as fid:
    gnb_loaded = cPickle.load(fid)

Répondu el 15 de Mai, 2012 par mwv (621 Points )

Answer 3

227voto

ogrisel Points 13211

Vous pouvez également utiliser joblib.vidage et joblib.charge qui est beaucoup plus efficace lors de la manipulation numérique des tableaux de la valeur par défaut de python pickler.

Joblib est inclus dans scikit-learn:

>>> from sklearn.externals import joblib
>>> from sklearn.datasets import load_digits
>>> from sklearn.linear_model import SGDClassifier

>>> digits = load_digits()
>>> clf = SGDClassifier().fit(digits.data, digits.target)
>>> clf.score(digits.data, digits.target)  # evaluate training error
0.9526989426822482

>>> filename = '/tmp/digits_classifier.joblib.pkl'
>>> _ = joblib.dump(clf, filename, compress=9)

>>> clf2 = joblib.load(filename)
>>> clf2
SGDClassifier(alpha=0.0001, class_weight=None, epsilon=0.1, eta0=0.0,
       fit_intercept=True, learning_rate='optimal', loss='hinge', n_iter=5,
       n_jobs=1, penalty='l2', power_t=0.5, rho=0.85, seed=0,
       shuffle=False, verbose=0, warm_start=False)
>>> clf2.score(digits.data, digits.target)
0.9526989426822482

Répondu el 23 de Juin, 2012 par ogrisel (13211 Points )

Enregistrer NaiveBayes classificateur à disque en Scikits apprendre

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Enregistrer NaiveBayes classificateur à disque en Scikits apprendre

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: