J'ai un DataFrame avec de nombreuses valeurs manquantes dans les colonnes que je souhaite regrouper :
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']})
In [4]: df.groupby('b').groups
Out[4]: {'4': [0], '6': [2]}
voir que Pandas a abandonné les lignes avec des valeurs cibles NaN. (Je veux inclure ces lignes !)
Comme j'ai besoin de nombreuses opérations de ce type (de nombreuses colonnes ont des valeurs manquantes), et que j'utilise des fonctions plus compliquées que les médianes (typiquement des forêts aléatoires), je veux éviter d'écrire des morceaux de code trop compliqués.
Des suggestions ? Dois-je écrire une fonction pour cela ou existe-t-il une solution simple ?