J'ai un tableau de données avec des valeurs répétées dans la colonne A. Je veux supprimer les doublons, en conservant la ligne avec la valeur la plus élevée dans la colonne B.
Voici donc ce qu'il en est :
A B
1 10
1 20
2 30
2 40
3 10
Il devrait se transformer en ceci :
A B
1 20
2 40
3 10
Je suppose qu'il y a probablement un moyen simple de faire cela - peut-être aussi simple que de trier le DataFrame avant de supprimer les doublons - mais je ne connais pas assez bien la logique interne de groupby pour la comprendre. Des suggestions ?