2 votes

Que calculent les niveaux stat_intervalle de {ggdist} (je pensais que c'était des intervalles de confiance mais ce n'est pas correct) ?

J'utilise ggdist (ce qui est génial) pour montrer la variabilité au sein d'un échantillon. J'ai une série de moyennes, d'écarts types et d'erreurs types et je veux utiliser la fonction stat_interval() pour afficher les intervalles de confiance à 50%, 80%, 90% et 95% de ces échantillons. Il semble qu'ils calculent quelque chose de différent car les intervalles tracés sont très différents de ceux que je calcule manuellement. Quelqu'un sait-il ce que je fais mal / ce que fait la fonction ?

L'IC à 95% de l'échantillon 1 dans le graphique ci-joint devrait être de 39,38 - 39,62 mais il est tracé beaucoup plus grand (près de 38,5 - 40,5, voir image).

Reprex

library(tidyverse)
library(ggdist)

 data <- tibble::tribble(
            ~n,          ~mean,     ~SD,       ~se,
           "Sample 1",    39.5,     0.5,    0.0625,
           "Sample 2",    39.4,     0.6,    0.0750
           )

 data |>
   ggplot(aes(xdist = dist_normal(mean, SD),  y = fct_rev(factor(n)))) +
            stat_interval(.width = c(.5, .8, .9, .95), position = "dodge")

stat_interval_plot

2voto

Devin Points 61

Je crois que les plages tracées sont simplement les quantiles, et non les intervalles de confiance, par exemple :

> quantile(rnorm(10000, 39.5, 0.5), c(0.025, 0.975 ))
    2.5%    97.5% 
38.49979 40.46578

Pour les intervalles de confiance, je pense que vous recherchez les étudiants T. Par exemple :

data %>%
  ggplot(aes(xdist = distributional::dist_student_t( 63, mean, se),  y = fct_rev(factor(n)))) +
  stat_interval(.width = c(.5, .8, .9, .95), position = "dodge")

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X