Je suis débutant et j'aimerais avoir de l'aide pour un travail. J'ai des données dans un fichier Excel qui représentent le nombre de clics par heure et par navigateur. Les données ressemblent à quelque chose comme ceci :
v11 v12 v13 v14 date
6.111111111 0.066666667 3.488888889 0.155555556 12-12-2016 0:00:00
Il y a des données jusqu'au début de 2017 et je suis censé prédire les valeurs après la dernière date.
J'ai essayé de créer une série temporelle (ts,start,end, frequency) afin d'utiliser arima pour estimer les valeurs futures mais pour certaines raisons la date apparaît incorrecte. Je me retrouve avec une date de début de 1992 alors que j'ai spécifié 2016-12-12 (voir ci-dessous).
#Load data from Excel file
data1 <- read.xlsx("Training data set.xlsx", sheetIndex = 1,colIndex=1)
data1 <- data.matrix(data1)
v1 <- c(data1)
v1.timeseries <- ts(v1, start = c(2016-12-12,1), frequency = 24)
print(v1.timeseries)
Time Series:
Start = c(1992, 1)
End = c(2020, 24)
Frequency = 24
[1] 92.86667 80.13333 76.37778 91.80000 119.06667 151.40000 176.57778
J'ai alors pensé qu'une régression serait une meilleure idée, mais je ne suis pas en mesure de transformer la colonne de date en heure aaaa-mm-jj que R lit. J'ai cherché en ligne et je n'ai pas réussi à comprendre comment configurer mes données dans R afin de faire des prédictions.
Quelqu'un peut-il m'aider ?
Merci de votre attention !