Il existe plusieurs options pour supprimer une ou plusieurs colonnes avec dplyr::select()
et quelques fonctions d'aide. Les fonctions d'aide peuvent être utiles car certaines ne nécessitent pas de nommer toutes les colonnes spécifiques à supprimer. Notez que pour déposer des colonnes en utilisant select()
vous devez utiliser un caractère de tête -
pour annuler les noms des colonnes.
Utilisation de la dplyr::starwars
données d'échantillon pour une certaine variété dans les noms de colonnes :
library(dplyr)
starwars %>%
select(-height) %>% # a specific column name
select(-one_of('mass', 'films')) %>% # any columns named in one_of()
select(-(name:hair_color)) %>% # the range of columns from 'name' to 'hair_color'
select(-contains('color')) %>% # any column name that contains 'color'
select(-starts_with('bi')) %>% # any column name that starts with 'bi'
select(-ends_with('er')) %>% # any column name that ends with 'er'
select(-matches('^v.+s$')) %>% # any column name matching the regex pattern
select_if(~!is.list(.)) %>% # not by column name but by data type
head(2)
# A tibble: 2 x 2
homeworld species
<chr> <chr>
1 Tatooine Human
2 Tatooine Droid
Vous pouvez également déposer par numéro de colonne :
starwars %>%
select(-2, -(4:10)) # column 2 and columns 4 through 10
2 votes
Duplicata possible de Suppression des colonnes dans un cadre de données R