Voici un exemple de mon cadre de données :
df_lst = [
{"wordcount": 100, "Stats": 198765, "id": 34},
{"wordcount": 99, "Stats": 98765, "id": 35},
{"wordcount": 200, "Stats": 18765, "id": 36},
{"wordcount": 250, "Stats": 788765, "id": 37},
{"wordcount": 345, "Stats": 12765, "id": 38},
{"wordcount": 456, "Stats": 238765, "id": 39},
{"wordcount": 478, "Stats": 1934, "id": 40},
{"wordcount": 890, "Stats": 19845, "id": 41},
{"wordcount": 812, "Stats": 1987, "id": 42}]
df = pd.DataFrame(df_lst)
df.set_index('id', inplace=True)
df.head()
DF :
Stats wordcount
id
34 198765 100
35 98765 99
36 18765 200
37 788765 250
38 12765 345
Je voudrais calculer la moyenne Stats
pour chaque plage de wordcount
avec un pas de 100, de sorte que le nouveau cadre de données ressemble à ceci :
Average wordcount
194567 100
23456 200
2378 300
...
Où 100 signifie de 0 à 100, etc. J'ai commencé à écrire des conditions multiples mais j'ai l'impression qu'il y a un moyen plus efficace d'y parvenir. Je vous remercie de votre aide.