2 votes

Colonne vers l'ID de transaction pour les règles d'association sur les cadres de données à partir de Pandas Python.

J'ai importé un CSV dans Python avec Pandas et j'aimerais pouvoir utiliser l'une des colonnes comme identifiant de transaction afin de pouvoir établir des règles d'association.

(lien : https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv )

J'espère que quelqu'un pourra m'aider :

Utiliser l'UUID comme ID de transaction pour avoir un cadre de données comme le suivant :

UUID     Desc
123ex    Meat,Beer

Pour que je puisse obtenir des règles d'association comme : {Viande} => {Bière}.

Aussi, une recommandation sur une bibliothèque pour le faire de manière simple serait appréciée.

Merci pour votre temps.

2voto

EdChum Points 10205

Vous pouvez agréger des valeurs dans une liste en procédant comme suit :

df.groupby('UUID')['Desc'].apply(list)

Cela vous donnera ce que vous voulez, si vous voulez récupérer l'UUID comme une colonne, vous pouvez appeler reset_index sur ce qui précède :

df.groupby('UUID')['Desc'].apply(list).reset_index()

De plus, pour une série, vous pouvez toujours exporter ces données vers un csv, comme pour un df :

df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)

Il se peut que vous deviez nommer votre index avant de l'exporter ou, si vous trouvez cela plus facile, il vous suffit de cliquer sur le lien suivant reset_index pour restaurer l'index comme une colonne et ensuite appeler to_csv

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X