13 votes

Récupérer les lignes avec une date maximale à partir d'un cadre de données pandas.

J'ai un dataframe pandas qui ressemble à ceci :

enter image description here

et je veux récupérer pour chaque ID distinct, la ligne avec la date maximale afin que mes résultats finaux ressemblent à ceci :

enter image description here

Ma colonne de date est de type "objet". J'ai essayé de regrouper les données puis de saisir le maximum comme suit :

idx = df.groupby(['ID','Item'])['date'].transform(max) == df_Trans['date']
df_new = df[idx]

Cependant, je ne parviens pas à obtenir le résultat souhaité. Toute aide sur ce problème serait grandement appréciée !

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X