J'ai les données suivantes (coût d'un produit vs temps) qui ressemblent à ceci :
annum <- c(1903, 1904, 1905, 1906, 1907, 1908, 1909, 1910, 1911, 1912, 1913,
1914, 1915, 1916, 1917, 1918, 1919)
cost <- c(0.0000, 18.6140, 92.1278, 101.9393, 112.0808, 122.5521,
133.3532, 144.4843, 244.5052, 275.6068, 295.2592, 317.3145,
339.6527, 362.3537, 377.7775, 402.8443, 437.5539)
mydata <- as.data.frame(cbind(annum, cost))
g <- ggplot(mydata, aes(x = annum, y = cost))
g <- g + geom_point()
g <- g + scale_y_continuous(labels=scales::dollar_format())
g
Voici le graphique résultant de ces données en utilisant ce code Le graphique montre quelque chose qui ressemble à une pièce linéaire pour moi ; il y a un saut de 1904 à 1905 ; puis une ligne claire de 1905 à 1910 ; puis un saut ; et ensuite une autre ligne de 1911 à la fin. (Le premier point (1903, 0) est fictif.)
J'ai essayé d'utiliser le package segmenté pour modéliser cela, mais au lieu de choisir quelque chose comme 1904.5 et 1910.5 comme points de rupture, il trouve deux points entre 1911 et 1912.
J'ai essayé d'autres techniques (par ex. "brute force" de "The R Book," et ajustement direct), mais je ne comprends clairement pas cela autant que j'en ai besoin. Toute aide serait très appréciée.
Idéalement, j'aimerais obtenir une équation pour chaque segment et un seul graphique montrant l'ajustement en pièces et un intervalle de confiance pour l'ajustement.