J'ai un dataframe comme ci-dessous et je veux comparer les lignes entre elles. Ensuite, il faut compter combien de fois deux lignes ont dans toutes les colonnes la valeur un.
object |A|B|C|D|E
101 1 1 1 1 1
102 1 0 1 0 0
103 0 1 0 1 1
ce que je veux voir (j'ai mis NaN car comparer la même ligne avec elle-même n'a pas de sens).
101 | 102 | 103
101 NaN 2 3
102 2 NaN 0
103 3 0 NaN
Pour l'instant, je ne fais que ça, mais cela ne concerne que les colonnes, et pas les lignes :
data=pd.DataFrame()#dummy
matrix=data.T.dot(data.T)