2 votes

Comment prédire les données horaires

Je suis débutant et j'aimerais avoir de l'aide pour un travail. J'ai des données dans un fichier Excel qui représentent le nombre de clics par heure et par navigateur. Les données ressemblent à quelque chose comme ceci :

        v11         v12         v13         v14               date
6.111111111 0.066666667 3.488888889 0.155555556 12-12-2016 0:00:00

Il y a des données jusqu'au début de 2017 et je suis censé prédire les valeurs après la dernière date.

J'ai essayé de créer une série temporelle (ts,start,end, frequency) afin d'utiliser arima pour estimer les valeurs futures mais pour certaines raisons la date apparaît incorrecte. Je me retrouve avec une date de début de 1992 alors que j'ai spécifié 2016-12-12 (voir ci-dessous).

#Load data from Excel file
data1 <- read.xlsx("Training data set.xlsx", sheetIndex = 1,colIndex=1)
data1 <- data.matrix(data1)
v1 <- c(data1)
v1.timeseries <- ts(v1, start = c(2016-12-12,1), frequency = 24)
print(v1.timeseries)
Time Series:
Start = c(1992, 1) 
End = c(2020, 24) 
Frequency = 24 
[1]  92.86667  80.13333  76.37778  91.80000 119.06667 151.40000 176.57778

J'ai alors pensé qu'une régression serait une meilleure idée, mais je ne suis pas en mesure de transformer la colonne de date en heure aaaa-mm-jj que R lit. J'ai cherché en ligne et je n'ai pas réussi à comprendre comment configurer mes données dans R afin de faire des prédictions.

Quelqu'un peut-il m'aider ?

Merci de votre attention !

0voto

JustCurious Points 71

**

Je ne parviens pas à transformer la colonne des dates en colonne des années. que R lit

**

Supposons qu'il s'agisse de votre fichier texte (trial.txt), comme indiqué ci-dessous,

    v11 v12 v13 v14 date
6.111111111 0.066666667 3.488888889 0.155555556  12-12-2016 13:30:20

Lire le fichier texte dans R

df = read.table("trial.txt", header=T, sep="\t")

> df
       v11        v12      v13       v14                 date
1 6.111111 0.06666667 3.488889 0.1555556  12-12-2016 13:30:20
> class(df$date)
[1] "factor"
> df$date = as.POSIXct(df$date, format="%d-%m-%Y %H:%M:%S")
> class(df$date)
[1] "POSIXct" "POSIXt" 
> df$date
[1] "2016-12-12 13:30:20 IST"
> df
       v11        v12      v13       v14                date
1 6.111111 0.06666667 3.488889 0.1555556 2016-12-12 13:30:20

L'exemple ci-dessus convertit la colonne date au format aaaa-mm-jj qui peut être lu par R.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X