Nous disposons d'une base de données provenant d'un fichier CSV. La base de données DF
comporte des colonnes contenant des valeurs observées et une colonne ( VaR2
) qui contient la date à laquelle une mesure a été prise. Si la date n'a pas été enregistrée, le fichier CSV contient la valeur NA
pour les données manquantes.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Nous souhaitons utiliser la commande subset pour définir un nouveau cadre de données new_DF
de telle sorte qu'il ne contienne que les lignes qui ont un NA'
de la colonne ( VaR2
). Dans l'exemple donné, seule la ligne 2 sera contenue dans le nouveau fichier DF
.
La commande
new_DF<-subset(DF, DF$Var2=="NA")
ne fonctionne pas, le cadre de données résultant n'a pas d'entrées de ligne.
Si, dans le fichier CSV d'origine, la valeur NA
sont échangés avec NULL
la même commande produit le résultat souhaité :
new_DF <- subset(DF, DF$Var2=="NULL")
Comment faire fonctionner cette méthode si, pour la chaîne de caractères, la valeur NA
est fourni dans le fichier CSV d'origine ?