J'ai un DataFrame avec environ 1000 colonnes, certaines colonnes ont 0 NaNs, d'autres 3, d'autres 400.
Ce que je veux faire, c'est supprimer toutes les colonnes où il existe un nombre de NaN consécutifs supérieur à un certain seuil N, le reste étant imputé en prenant la moyenne des voisins les plus proches.
df
ColA | ColB | ColC | ColD | ColE
NaN 5 3 NaN NaN
NaN 6 NaN 4 4
NaN 7 4 4 4
NaN 5 5 NaN NaN
NaN 5 4 NaN 4
NaN 3 3 NaN 3
threshold = 2
remove_consecutive_nan(df,threshold)
Ce qui donnerait
ColB | ColC | ColE
5 3 NaN
6 NaN 4
7 4 4
5 5 NaN
5 4 4
3 3 3
Comment dois-je écrire le remove_consecutive_nan
fonction ?