J'ai du mal à comprendre le processus de Naive Bayes, et je me demandais si quelqu'un pouvait l'expliquer avec un processus simple étape par étape en anglais. Je comprends qu'il prend les comparaisons en fonction des occurrences sous forme de probabilité, mais je n'ai aucune idée de la manière dont les données d'entraînement sont liées à l'ensemble de données réel.
Veuillez m'expliquer le rôle que joue l'ensemble d'entraînement. Je donne un exemple très simple pour les fruits, comme la banane par exemple.
training set---
round-red
round-orange
oblong-yellow
round-red
dataset----
round-red
round-orange
round-red
round-orange
oblong-yellow
round-red
round-orange
oblong-yellow
oblong-yellow
round-red
19 votes
C'est assez facile si vous comprenez le théorème de Bayes. Si vous n'avez rien lu sur le théorème de Bayes, essayez ce lien. yudkowsky.net/rational/bayes .
23 votes
NOTE : La réponse acceptée ci-dessous n'est pas un exemple traditionnel pour Naïve Bayes. Il s'agit plutôt d'une mise en œuvre de k Nearest Neighbor. Lire en conséquence.
0 votes
Voici une description rapide et visuelle du théorème de Bayes par Oscar Bonilla. oscarbonilla.com/2009/05/visualiser-bayes-theorem
2 votes
Eh bien, si l'on voit un graphique avec quelques points, cela ne signifie pas vraiment qu'il s'agit de KNN :) La façon dont vous calculez les probabilités dépend de vous. Naive Bayes les calcule en utilisant les antériorités multipliées par la vraisemblance, c'est ce que Yavar a montré dans sa réponse. La façon d'arriver à ces probabilités n'est pas vraiment importante ici. La réponse est tout à fait correcte et je n'y vois aucun problème.
2 votes
Je vote pour clore cette question parce que Les questions sur la théorie de l'apprentissage automatique (ML) sont hors sujet sur Stack Overflow - candidat à l'emballage cadeau pour le Cross-Validated