J'ai des données multivariées sur la beauté en fonction de l'âge. Les âges vont de 20 à 40 ans à des intervalles de 2 (20, 22, 24....40), et pour chaque enregistrement de données, on leur donne un âge et une note de beauté de 1 à 5. Lorsque je fais des boxplots de ces données (âges sur l'axe des X, notes de beauté sur l'axe des Y), il y a quelques valeurs aberrantes tracées en dehors des moustaches de chaque boîte.
Je veux supprimer ces valeurs aberrantes du cadre de données lui-même, mais je ne sais pas comment R calcule les valeurs aberrantes pour ses diagrammes en boîte. Voici un exemple de ce à quoi mes données pourraient ressembler.
2 votes
Le site
boxplot
renvoie les valeurs aberrantes (entre autres statistiques) de manière invisible. Essayezfoo <- boxplot(...); foo
et lire?boxplot
pour comprendre la sortie.0 votes
Vous devriez modifier votre question en fonction du commentaire que vous avez fait sur la réponse de @Prasad !
0 votes
@aL3xa : c'est dans la première phrase du deuxième paragraphe.
29 votes
Pertinent : davidmlane.com/ben/outlier.gif
1 votes
Pouvez-vous envoyer un lien vers les données ?