J'ai donc la base de données suivante :
et ce que je veux, c'est trouver la combinaison de gènes qui sont le plus souvent présents ensemble.
sample genea geneb genec gened genee genef
1 1 1 1 1 0 0 0
2 2 1 1 1 0 0 0
3 3 1 0 0 1 1 1
4 4 0 0 0 0 0 0
5 5 1 0 1 1 1 1
6 6 0 0 0 0 0 0
Donc, dans ce cas, mon résultat souhaité serait : gène a + c = 3 échantillons se chevauchent.
test[sort.list(colSums(test[,-1]), decreasing=TRUE)[1:15] +1])
me donne une liste contenant au maximum 1 valeur par gène. Mais je suis bloqué avec ceci.
Comment aborder cette question ?