LogisticRegression: Inconnu type d'étiquette: "continu" à l'aide de sklearn en python

Question

LogisticRegression: Inconnu type d'étiquette: "continu" à l'aide de sklearn en python

Demandé el 29 de Janvier, 2017: Quand la question a-t-elle été
60220 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai le code suivant pour tester quelques-uns des plus populaires ML algorithmes de sklearn bibliothèque python:

import numpy as np
from sklearn                        import metrics, svm
from sklearn.linear_model           import LinearRegression
from sklearn.linear_model           import LogisticRegression
from sklearn.tree                   import DecisionTreeClassifier
from sklearn.neighbors              import KNeighborsClassifier
from sklearn.discriminant_analysis  import LinearDiscriminantAnalysis
from sklearn.naive_bayes            import GaussianNB
from sklearn.svm                    import SVC

trainingData    = np.array([ [2.3, 4.3, 2.5],  [1.3, 5.2, 5.2],  [3.3, 2.9, 0.8],  [3.1, 4.3, 4.0]  ])
trainingScores  = np.array( [3.4, 7.5, 4.5, 1.6] )
predictionData  = np.array([ [2.5, 2.4, 2.7],  [2.7, 3.2, 1.2] ])

clf = LinearRegression()
clf.fit(trainingData, trainingScores)
print("LinearRegression")
print(clf.predict(predictionData))

clf = svm.SVR()
clf.fit(trainingData, trainingScores)
print("SVR")
print(clf.predict(predictionData))

clf = LogisticRegression()
clf.fit(trainingData, trainingScores)
print("LogisticRegression")
print(clf.predict(predictionData))

clf = DecisionTreeClassifier()
clf.fit(trainingData, trainingScores)
print("DecisionTreeClassifier")
print(clf.predict(predictionData))

clf = KNeighborsClassifier()
clf.fit(trainingData, trainingScores)
print("KNeighborsClassifier")
print(clf.predict(predictionData))

clf = LinearDiscriminantAnalysis()
clf.fit(trainingData, trainingScores)
print("LinearDiscriminantAnalysis")
print(clf.predict(predictionData))

clf = GaussianNB()
clf.fit(trainingData, trainingScores)
print("GaussianNB")
print(clf.predict(predictionData))

clf = SVC()
clf.fit(trainingData, trainingScores)
print("SVC")
print(clf.predict(predictionData))

Les deux premiers ouvrages ok, mais j'ai l'erreur suivante en LogisticRegression appel:

root@ubupc1:/home/ouhma# python stack.py 
LinearRegression
[ 15.72023529   6.46666667]
SVR
[ 3.95570063  4.23426243]
Traceback (most recent call last):
  File "stack.py", line 28, in <module>
    clf.fit(trainingData, trainingScores)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/linear_model/logistic.py", line 1174, in fit
    check_classification_targets(y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/multiclass.py", line 172, in check_classification_targets
    raise ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'continuous'

Les données d'entrée sont les mêmes que dans les précédents appels, de sorte que ce qui se passe ici?

Et par la façon, pourquoi il y a une énorme diference dans la première prédiction de l' LinearRegression() et SVR() algorithmes (15.72 vs 3.95)?

Demandé el 29 de Janvier, 2017 par Joana

Answer 1

2 Réponses

Answer 2

124voto

Maximilian Peters Points 13600

Vous êtes de passage à flotteurs à un classificateur qui attend catégorique valeurs comme la cible de vecteur. Si vous le convertissez en int il sera accepté comme entrée (bien qu'il va être discutable si c'est la bonne façon de le faire).

Il serait préférable de convertir votre formation scores en utilisant scikit de l' labelEncoder fonction.

Le même est vrai pour votre DecisionTree et KNeighbors qualificatif.

from sklearn import preprocessing
from sklearn import utils

lab_enc = preprocessing.LabelEncoder()
encoded = lab_enc.fit_transform(trainingScores)
>>> array([1, 3, 2, 0], dtype=int64)

print(utils.multiclass.type_of_target(trainingScores))
>>> continuous

print(utils.multiclass.type_of_target(trainingScores.astype('int')))
>>> multiclass

print(utils.multiclass.type_of_target(encoded))
>>> multiclass

Répondu el 29 de Janvier, 2017 par Maximilian Peters (13600 Points )

Answer 3

35voto

Sam Perry Points 95

J'ai lutté avec le même problème lorsque vous essayez de nourrir les flotteurs pour les classificateurs. Je voulais garder des flotteurs et non pas des nombres entiers pour la précision. Essayez d'utiliser régresseur algorithmes. Par exemple:

import numpy as np
from sklearn import linear_model
from sklearn import svm

classifiers = [
    svm.SVR(),
    linear_model.SGDRegressor(),
    linear_model.BayesianRidge(),
    linear_model.LassoLars(),
    linear_model.ARDRegression(),
    linear_model.PassiveAggressiveRegressor(),
    linear_model.TheilSenRegressor(),
    linear_model.LinearRegression()]

trainingData    = np.array([ [2.3, 4.3, 2.5],  [1.3, 5.2, 5.2],  [3.3, 2.9, 0.8],  [3.1, 4.3, 4.0]  ])
trainingScores  = np.array( [3.4, 7.5, 4.5, 1.6] )
predictionData  = np.array([ [2.5, 2.4, 2.7],  [2.7, 3.2, 1.2] ])

for item in classifiers:
    print(item)
    clf = item
    clf.fit(trainingData, trainingScores)
    print(clf.predict(predictionData),'\n')

Répondu el 23 de Décembre, 2017 par Sam Perry (95 Points )

LogisticRegression: Inconnu type d'étiquette: "continu" à l'aide de sklearn en python

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

LogisticRegression: Inconnu type d'étiquette: "continu" à l'aide de sklearn en python

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: