J'ai le cadre de données ci-dessous sur lequel j'essaie de regrouper et d'agréger les données.
Column_1 Column_2 Column_3
A N1 P1
A N2 P2
A N3 P3
B N1 P1
C N1 P1
C N2 P2
Sortie requise :
Column_1 Column_2 Column_3
A N1,N2,N3 P1,P2,P3
B N1 P1
C N1,N2 P1,P2
Je suis capable de le faire sur une colonne en créant une fenêtre en utilisant la partition et le groupby. Ensuite, j'utilise collect list et groupby sur la fenêtre et j'agrège pour obtenir une colonne. Cela fonctionne pour une seule colonne.
Comment effectuer la même chose sur 2 colonnes. Merci de m'aider.