J'ai un très grand dataframe avec des lignes comme observations et des colonnes comme marqueurs génétiques. Je voudrais créer une nouvelle colonne qui contient la somme d'un certain nombre de colonnes sélectionnées pour chaque observation en utilisant R.
Si j'ai 200 colonnes et 100 lignes, alors je voudrais créer une nouvelle colonne qui a 100 lignes avec la somme par exemple des colonnes 43 à 167. Les colonnes ont soit 1 soit 0. Avec la nouvelle colonne qui contient la somme de chaque ligne, je pourrai trier les individus qui ont le plus de marqueurs génétiques.
Je pense que cela ressemble à quelque chose comme:
data$new=sum(data$[,43:167])