J'ai deux colonnes de catégories, avec les mêmes options possibles dans les deux colonnes, et je cherche à compter le nombre de lignes par combinaison unique, indépendamment de l'ordre des catégories dans chaque ligne (colonne A ou colonne B).
Exemple de cadre de données :
df1 = pd.DataFrame({'A':['dog','cat','mouse','bunny','cat','mouse','dog'],
'B':['cat','dog','dog','mouse','bunny','bunny','cat']})
Ce qui ressemblerait à :
----------------------------
index A B
0 dog cat
1 cat dog
2 mouse dog
3 bunny mouse
4 cat bunny
5 mouse bunny
6 dog cat
-----------------------------
Et j'aimerais que le résultat ressemble à ça :
--------------------------------------
index A B count
0 dog cat 3
1 bunny mouse 2
2 mouse dog 1
3 cat bunny 1
--------------------------------------
Je peux obtenir le nombre de combinaisons où chien/chat est compté séparément de chat/chien, mais j'ai du mal à trouver comment obtenir le nombre de combinaisons indépendamment de la première catégorie.