Je dois les données suivantes (3 millions de lignes) :
user_id | datetime | type
1 | 2015-01-01 | q
1 | 2015-01-01 | d
1 | 2015-01-02 | d
2 | 2015-01-01 | d
2 | 2015-01-02 | q
2 | 2015-01-02 | q
Je veux obtenir le dataframe suivant :
user_id | 2015-01-01 | 2015-01-02
1 | q:1, d:1 | d:1
2 | d:1 | q:2
Je sais que je pourrais utiliser pivot_table
s'il n'y avait pas la colonne type
. Cependant, j'ai aussi besoin de la prendre en compte. Je me demande si quelqu'un a une solution élégante à ce problème ?
P.S. Les cellules du tableau de sortie ne doivent pas nécessairement avoir exactement le même aspect. En tant que solution alternative, les comptages (de d et q) pourraient être ignorés.