J'ai un ensemble de données à deux colonnes avec environ 30000 clusters et 10 facteurs comme ceci :
cluster-1 Factor1
cluster-1 Factor2
...
cluster-2 Factor2
cluster-2 Factor3
...
Et je voudrais représenter la co-occurrence des facteurs dans l'ensemble des clusters. Quelque chose comme "Facteur1+Facteur3+Facteur5 dans 1234 clusters", et ainsi de suite pour les différentes combinaisons. Je pensais que je pourrais faire quelque chose comme un diagramme circulaire, mais avec 10 facteurs, je pense qu'il peut y avoir trop de combinaisons.
Quelle serait une bonne façon de représenter cela ?