J'ai le cadre de données suivant df
:
time_diff avg_trips_per_day
631 1.0
231 1.0
431 1.0
7031 1.0
17231 1.0
20000 20.0
21000 15.0
22000 10.0
Je souhaite créer un histogramme avec time_diff
sur l'axe X et avg_trips_per_day
sur l'axe Y afin de voir la distribution des valeurs de time_diff
. L'axe Y n'est donc pas la fréquence des répétitions des valeurs X en df
mais il devrait l'être avg_trips_per_day
. Le problème, c'est que je ne sais pas comment mettre time_diff
en bacs afin de la traiter comme une variable continue.
C'est ce que j'essaie de faire, mais toutes les valeurs possibles de time_diff
sur l'axe X.
norm = plt.Normalize(df["avg_trips_per_day"].values.min(), df["avg_trips_per_day"].values.max())
colors = plt.cm.spring(norm(df["avg_trips_per_day"]))
plt.figure(figsize=(12,8))
ax = sns.barplot(x="time_diff", y="avg_trips_per_day", data=df, palette=colors)
plt.xticks(rotation='vertical', fontsize=12)
ax.grid(b=True, which='major', color='#d3d3d3', linewidth=1.0)
ax.grid(b=True, which='minor', color='#d3d3d3', linewidth=0.5)
plt.show()