95 votes

Supprimer la partie de la chaîne après "."

Je travaille avec les numéros d'accession des séquences de référence du NCBI, comme les variables. a :

a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2")  

Pour obtenir des informations à partir du paquet biomart, je dois supprimer le fichier .1 , .2 etc. après les numéros d'accès. Je fais normalement cela avec ce code :

b <- sub("..*", "", a)

# [1] "" "" "" "" "" ""

Mais comme vous pouvez le constater, ce n'est pas la bonne méthode pour cette variable. Quelqu'un peut-il m'aider ?

0voto

sahwahn Points 66

Une autre option consiste à utiliser str_split de stringr :

library(stringr)
str_split(a, "\\.", simplify=T)[,1]

[1] "NM_020506"    "NM_020519"    "NM_001030297" "NM_010281"    "NM_011419"    "NM_053155"

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X