Suppression des doublons sur la base d'une catégorie spécifique d'une autre colonne

Question

Suppression des doublons sur la base d'une catégorie spécifique d'une autre colonne

Demandé el 29 de Juin, 2021: Quand la question a-t-elle été
52 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je souhaite supprimer les doublons IDs dans mes données à l'aide de l'outil Category colonnes. Un sous-ensemble de mes données est le suivant :

df <- data.frame(ID=c(1,2,3,4,1,4,2),
                 category=c("a","b","c","d","b","a","a"))
df

  ID category
1  1        a
2  2        b
3  3        c
4  4        d
5  1        b
6  4        a
7  2        a

S'il y a un doublon ID de Category b Je dois donc le conserver et supprimer l'identifiant correspondant des autres catégories. De plus, je n'ai aucune priorité si l'identifiant dupliqué doit être supprimé. IDs constituent d'autres catégories à l'exclusion de Category b . Mon résultat préféré est donc le suivant :

  ID category
1  2        b
2  3        c
3  4        d
4  1        b

J'ai déjà lu cet article : R : Supprimer les doublons d'une base de données en fonction des catégories d'une colonne mais je n'arrive pas à trouver ma réponse

Demandé el 29 de Juin, 2021 par Alex

Answer 1

2 Réponses

Answer 2

1voto

akrun Points 148302

Nous pourrions faire une arrange à ce que les lignes de la catégorie "b" soient disposées en haut et qu'elles obtiennent ensuite les lignes de la catégorie "c". distinct lignes par "ID

library(dplyr)
df %>%
     arrange(category != 'b') %>% 
     distinct(ID, .keep_all = TRUE)

-sortie

  ID category
1  2        b
2  1        b
3  3        c
4  4        d

Ou en utilisant base R

df[order(df$category != 'b'), ] -> df1
df1[!duplicated(df1$ID), ]

Répondu el 29 de Juin, 2021 par akrun (148302 Points )

Answer 3

0voto

Onyambu Points 16644

Dans la base R, vous pourriez faire :

 subset(df, !category %in% category[ID %in% ID[category == 'b'] & category !='b'])
  ID category
1  2        b
2  3        c
3  4        d
4  1        b

Répondu el 29 de Juin, 2021 par Onyambu (16644 Points )

Suppression des doublons sur la base d'une catégorie spécifique d'une autre colonne

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Suppression des doublons sur la base d'une catégorie spécifique d'une autre colonne

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: