J'ai une liste d'âges en jours et je cherche à les afficher en années sur un graphique de densité.
J'ai procédé de deux manières : en remplaçant les étiquettes de l'axe des x par des années et en divisant les données par 365. Ces méthodes me donnent des estimations de densité différentes :
df <- data.frame(id = 1:80000, age = rnorm(80000, 46, 5) * 365)
Le premier graphique est généré à l'aide de :
breaks <- seq(from = min(df$age), to = max(df$age), by = 10*365)
ggplot(data = df, aes(x = age)) +
geom_density(aes(y = ..density..)) +
scale_x_continuous(breaks= breaks, labels = floor(breaks/365))
La densité affichée sur l'axe des ordonnées est comprise entre 0 et 0,0002.
Cependant, lorsque je fais cela (diviser les âges par 365 pour obtenir des années - et non pas simplement changer les étiquettes x comme ci-dessus) :
ggplot(data = df, aes(x = age/365)) +
geom_density(aes(y = ..density..))
Le graphique est identique mais la densité varie de 0 à 0,08. J'ai du mal à comprendre ce qui se passe - pourquoi la densité est-elle différente entre les deux tracés ?