44 votes

Dans ggplot2, que représente la fin des lignes de la boîte à moustaches?

Je ne trouve pas de description de ce que représentent les points finaux des lignes d'une boîte à moustaches.

Par exemple, voici les valeurs de points ci-dessus et ci-dessous où les lignes se terminent. entrez la description de l'image ici

(Je me rends compte que le haut et le bas de la boîte sont 25ème et 75ème centiles, et la ligne centrale est le 50ème). Je suppose, comme il y a des points au-dessus et au-dessous des lignes qu'ils ne représentent pas les valeurs max / min.

73voto

csgillespie Points 20349

Les "points" à la fin de la boîte à moustaches représentent les valeurs aberrantes. Il y a un certain nombre de règles pour déterminer si un point est un point aberrant, mais la méthode que R et ggplot utiliser est le "1.5 règle". Si un point de données est:

  • moins de Q1 - 1.5*IQR
  • plus de Q3 + 1.5*IQR

alors que le point est considéré comme une "valeurs aberrantes". La ligne passe au premier point de données avant de la "1.5" cut-off. Remarque: IQR = Q3 - Q1

Des informations supplémentaires

  • Voir le wikipedia boîte à moustaches de la page pour l'alternative des valeurs aberrantes règles.
  • Il ya en fait une variété de façons de calculer les quantiles. Ont un look à la `?quantiles pour la description de la période de neuf différentes méthodes.

Exemple

Considérons l'exemple suivant

> set.seed(1)
> x = rlnorm(20, 1/2)#skewed data
> par(mfrow=c(1,3))
> boxplot(x, range=1.7, main="range=1.7")
> boxplot(x, range=1.5, main="range=1.5")#default
> boxplot(x, range=0, main="range=0")#The same as range="Very big number"

Cela donne à la suite de l'intrigue: enter image description here

Comme nous l'avons diminution gamme de 1,7 à 1,5-nous réduire la longueur de la moustache. Toutefois, range=0 est un cas spécial - c'est l'équivalent de "gamme=l'infini"

15voto

Tyler Points 6320

Je pense que ggplot utilise les valeurs par défaut standard, la même chose que boxplot: "les moustaches s'étendent jusqu'au point de données le plus extrême qui ne dépasse pas [1,5] fois la longueur de la boîte loin de la boîte"

Voir: boxplot.stats

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X