J'ai un dataframe qui contient un éparpillement de valeurs NA
toy_df
# Y X1 X2 Label
# 5 3 3 A
# 3 NA 2 B
# 3 NA NA C
# 2 NA 6 B
Je veux regrouper ceci par le champ label, et compter combien de valeurs non NA il y a dans chaque variable pour chaque label.
résultat souhaité:
# Label Y X1 X2
# A 1 1 1
# B 2 0 2
# C 1 0 0
J'ai fait cela en utilisant des boucles pour l'instant, mais c'est lent et désordonné et je suis sûr qu'il y a une meilleure façon.
Aggregate semble aller à mi-chemin, mais il inclut les NA dans le décompte.
aggregate(toy_df, list(toy_df$label), FUN=length)
Toute idée est appréciée...