289 votes

Quelle est la différence entre l’apprentissage supervisé et non supervisé ?

En termes d’intelligence artificielle et apprentissage automatique. Pouvez-vous nous donner une explication basique, facile avec un exemple ?

505voto

Davide Points 5091

Puisque vous posez cette question très simple, on dirait qu'il vaut la peine de spécifier ce que l'Apprentissage de la Machine elle-même.

L'Apprentissage de la Machine est une classe d'algorithmes qui est piloté par les données, c'est à dire à la différence de "normal" algorithmes, il est les données qui "raconte" ce que la "bonne réponse" est. Exemple: un hypothétique non-algorithme d'apprentissage automatique pour la reconnaissance des visages dans les images d'essayer de définir ce qu'est un visage est (rond de la peau-comme la couleur du disque, avec une zone sombre où vous attendent les yeux etc). Un algorithme d'apprentissage automatique n'aurait pas une telle codé définition, mais va "apprendre par l'exemple": vous allez montrer plusieurs images de visages et de non-visages et un bon algorithme finira par apprendre et être en mesure de prédire si oui ou non une image invisible est un visage.

Cet exemple particulier de la reconnaissance du visage est supervisé, ce qui signifie que vos exemples doivent être étiquetés, ou explicitement dire ceux qui sont les visages et ceux qui ne le sont pas.

Dans une sans surveillance algorithme de vos exemples ne sont pas étiquetés, c'est à dire que vous ne dites pas n'importe quoi. Bien sûr, dans ce cas, l'algorithme lui-même ne peut pas "inventer" ce qu'est un visage qui est, mais il pourrait être en mesure de cluster les données dans une classe différente, par exemple, il pourrait être en mesure de distinguer les visages sont très différents panoramas, qui sont très différentes de chevaux.

Depuis une autre réponse de la mentionner (dans la mauvaise voie), il y a des "intermédiaires" forme de supervision, c'est à dire semi-supervisé et l'apprentissage actif des techniques. Techniquement, ce sont des méthodes supervisées, dans lequel il y a des "smart" de façon à éviter le grand nombre d'exemples étiquetés. Dans l'apprentissage actif, l'algorithme lui-même qui décide chose que vous devriez étiquette (par exemple, il peut être assez sûr au sujet d'un panorama et d'un cheval, mais il peut vous demander de confirmer si un gorille est en effet l'image d'un visage). En semi-supervisé approche, il y a deux algorithmes différents, qui commencent avec les exemples étiquetés, puis "dire" les uns les autres de façon de penser au sujet de certains grand nombre de sans étiquette de données. À partir de cette "discussion" ils apprennent.

60voto

Yann Schwartz Points 4801

Apprentissage supervisé est lorsque les données que vous nourrissez votre algorithme sont « tag » pour aider à prendre des décisions de votre logique.

Exemple : Bayes spam filtrage, où vous devez marquer un élément comme spam pour affiner les résultats.

Apprentissage non supervisé est les types d’algorithmes qui essaient de trouver des corrélations sans n’importe quelles entrées externes autres que les données brutes.

Exemple : algorithmes de regroupement datamining.

35voto

David Robles Points 4312

APPRENTISSAGE SUPERVISÉ

Les Applications dans lesquelles les données d'entraînement comprend des exemples de vecteurs en entrée avec leurs correspondants des vecteurs cibles sont connus comme des problèmes d'apprentissage supervisé.

L'APPRENTISSAGE NON SUPERVISÉ

En d'autres problèmes de reconnaissance de formes, les données d'entraînement se compose d'un ensemble de vecteurs en entrée x sans aucune valeurs cibles. L'objectif dans un tel apprentissage non supervisé des problèmes peut-être de découvrir des groupes d'exemples similaires dans les données, où il est appelé clustering

La Reconnaissance des formes et l'Apprentissage de la Machine (Bishop, 2006)

13voto

Gregory Pakosz Points 35546

Par exemple, très souvent, l'apprentissage d'un réseau de neurones est un apprentissage supervisé: vous indiquez au réseau à quelle classe correspond le vecteur de caractéristiques que vous nourrissez.

Le clustering est un apprentissage non supervisé: vous laissez l'algorithme décider du regroupement des échantillons en classes partageant des propriétés communes.

Les cartes auto-organisatrices de Kohonen sont un autre exemple d'apprentissage non supervisé.

6voto

StompChicken Points 6102

J'ai toujours trouvé que la distinction entre non supervisé et l'apprentissage supervisé arbitraire et un peu déroutant. Il n'y a pas de véritable distinction entre les deux cas, au lieu de cela, il existe une gamme de situations dans lesquelles un algorithme peut avoir plus ou moins de "supervision". L'existence d'apprentissage semi-supervisé est un des exemples les plus évidents, où la ligne est floue.

J'ai tendance à penser que la supervision de donner de la rétroaction à l'algorithme sur ce que des solutions devraient être privilégiées. Pour un traditionnel supervisé, telles que la détection de spam, vous dites à l'algorithme de "ne pas faire d'erreur sur l'ensemble de la formation"; pour un traditionnel sans surveillance, comme le clustering, vous dites à l'algorithme "des points qui sont proches les uns des autres doivent être dans le même cluster". Il se trouve que, la première forme de rétroaction est beaucoup plus précis que le dernier.

En bref, quand quelqu'un dit "supervisé", pensez classification, quand ils disent "non supervisée" penser le clustering et essayer de ne pas trop s'inquiéter à ce sujet au-delà.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X