Comment remplacer les valeurs NA par des zéros dans un cadre de données R ?

Question

Comment remplacer les valeurs NA par des zéros dans un cadre de données R ?

Demandé el 17 de Novembre, 2011: Quand la question a-t-elle été
84770 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un cadre de données et certaines colonnes ont NA valeurs.

Comment puis-je remplacer ces NA des valeurs avec des zéros ?

Demandé el 17 de Novembre, 2011 par Renato Dinhani Conceição

16 votes

petite modification de stackoverflow.com/questions/7279089/ (que j'ai trouvé en cherchant "[r] remplacer NA par zéro") ...

Commenté el 17 de Novembre, 2011 par Ben Bolker

36 votes

d[is.na(d)] <- 0

Commenté el 12 de Août, 2015 par psychonomics

Answer 1

5 Réponses

Answer 2

1152voto

aL3xa Points 10236

Voir mon commentaire dans la réponse de @gsk3. Un exemple simple :

> m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
> d <- as.data.frame(m)
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3 NA  3  7  6  6 10  6   5
2   9  8  9  5 10 NA  2  1  7   2
3   1  1  6  3  6 NA  1  4  1   6
4  NA  4 NA  7 10  2 NA  4  1   8
5   1  2  4 NA  2  6  2  6  7   4
6  NA  3 NA NA 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10  NA
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5 NA  9  7  2  5   5

> d[is.na(d)] <- 0

> d
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3  0  3  7  6  6 10  6   5
2   9  8  9  5 10  0  2  1  7   2
3   1  1  6  3  6  0  1  4  1   6
4   0  4  0  7 10  2  0  4  1   8
5   1  2  4  0  2  6  2  6  7   4
6   0  3  0  0 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10   0
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5  0  9  7  2  5   5

Il n'est pas nécessaire de postuler apply . =)

EDIT

Vous devriez également jeter un coup d'œil à norm paquet. Il possède de nombreuses fonctionnalités intéressantes pour l'analyse des données manquantes. =)

Répondu el 17 de Novembre, 2011 par aL3xa (10236 Points )

3 votes

J'ai déjà essayé ce code hier avant que vous le postiez et ça n'a pas marché. Parce que cela j'ai posté la question. Mais j'ai essayé de savoir et a travaillé parfaitement. Je pense que je faisais quelque chose de mal.

Commenté el 17 de Novembre, 2011 par Renato Dinhani Conceição

15 votes

@RenatoDinhaniConceição : si vous avez déjà essayé quelque chose, il est utile de partager cette information lorsque vous posez la question ; cela permet de préciser où se situe le problème.

Commenté el 17 de Novembre, 2011 par Aaron

2 votes

d[is.na(d)] <- 0 n'a pas de sens pour moi. Cela semble inversé ? Comment R traite-t-il cette déclaration ?

Commenté el 4 de Avril, 2015 par user798719

Afficher 6 autres commentaires

Answer 3

160voto

Ari B. Friedman Points 24940

Pour un seul vecteur :

x <- c(1,2,NA,4,5)
x[is.na(x)] <- 0

Pour un data.frame, créez une fonction à partir de ce qui précède, puis apply dans les colonnes.

Veuillez fournir un exemple reproductible la prochaine fois, comme indiqué ici :

Comment faire un excellent exemple reproductible en R ?

Répondu el 17 de Novembre, 2011 par Ari B. Friedman (24940 Points )

19 votes

is.na est une fonction générique, et possède des méthodes pour les objets de la catégorie data.frame donc celui-ci fonctionnera également sur data.frame s !

Commenté el 17 de Novembre, 2011 par aL3xa

3 votes

Quand j'ai couru methods(is.na) pour la première fois, j'étais comme whaaa ?!? . J'adore quand des trucs comme ça arrivent ! =)

Commenté el 17 de Novembre, 2011 par aL3xa

10 votes

Supposons que vous avez un cadre de données nommé df au lieu d'un vecteur unique et que vous voulez juste remplacer les observations manquantes dans une seule colonne nommée X3. Vous pouvez le faire avec cette ligne : df$X3[is.na(df$X3)] <- 0

Commenté el 22 de Février, 2013 par Mark Miller

Afficher 2 autres commentaires

Answer 4

95voto

ianmunoz Points 31

Exemple de dplyr :

library(dplyr)

df1 <- df1 %>%
    mutate(myCol1 = if_else(is.na(myCol1), 0, myCol1))

Note : Cela fonctionne par colonne sélectionnée, si nous avons besoin de le faire pour toutes les colonnes, voir @reidjax Réponse de l'entreprise en utilisant muté_chaque .

Répondu el 8 de Mai, 2014 par ianmunoz (31 Points )

Answer 5

69voto

mrsoltys Points 145

Si nous essayons de remplacer NA lors de l'exportation, par exemple lors de l'écriture vers csv, alors nous pouvons utiliser :

  write.csv(data, "data.csv", na = "0")

Répondu el 21 de Février, 2014 par mrsoltys (145 Points )

0 votes

Dope...........

Commenté el 29 de Mai, 2021 par The Way

Answer 6

6voto

Zahra Points 11

Vous pouvez utiliser replace()

Par exemple :

> x <- c(-1,0,1,0,NA,0,1,1)
> x1 <- replace(x,5,1)
> x1
[1] -1  0  1  0  1  0  1  1

> x1 <- replace(x,5,mean(x,na.rm=T))
> x1
[1] -1.00  0.00  1.00  0.00  0.29  0.00 1.00  1.00

Répondu el 30 de Mars, 2013 par Zahra (11 Points )

6 votes

Vrai, mais seulement pratique quand vous connaissez l'indice de NA dans votre vecteur. C'est très bien pour les petits vecteurs comme dans votre exemple.

Commenté el 8 de Avril, 2013 par dardisco

5 votes

@dardisco x1 <- replace(x,is.na(x),1) fonctionnera sans énumérer explicitement les valeurs d'index.

Commenté el 18 de Janvier, 2017 par lmo

Comment remplacer les valeurs NA par des zéros dans un cadre de données R ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment remplacer les valeurs NA par des zéros dans un cadre de données R ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: