J'ai le dataframe ci-dessous sur lequel j'essaie de regrouper et d'agrégér des données.
Column_1 Column_2 Column_3
A N1 P1
A N2 P2
A N3 P3
B N1 P1
C N1 P1
C N2 P2
Sortie requise :
Column_1 Column_2 Column_3
A N1,N2,N3 P1,P2,P3
B N1 P1
C N1,N2 P1,P2
Je suis capable de le faire sur une colonne en créant une fenêtre en utilisant la partition et groupby. Ensuite j'utilise collect list et group by sur la fenêtre et agrège pour obtenir une colonne. Cela fonctionne pour une colonne.
Comment réaliser la même chose sur 2 colonnes. Veuillez aider.