Je utilise généralement R. Si j'ai des données comme :
Produit Indice Valeur
a 1 0.5
a 1 0.4
c 1 1.4
c 2 0.75
e 2 0.6
f 3 0.9
Si mon code R est :
a <- data %>%
group_by(Produit) %>%
mutate(Drapeau=ifelse(all(Indice==1),'correct','incorrect'))
Cela signifie que je regroupe les données par Produit d'abord. Ensuite, pour chaque groupe, je lui attribuerai un nouveau champ appelé Drapeau. Si l'indice dans ce groupe est entièrement de 1, alors le Drapeau est correct, sinon il est incorrect. En même temps, tous les enregistrements sont conservés. Donc, le résultat devrait ressembler à :
Produit Indice Valeur Drapeau
a 1 0.5 correct
a 1 0.4 correct
c 1 1.4 incorrect
c 2 0.75 incorrect
e 2 0.6 incorrect
f 3 0.9 incorrect
Ma question est : comment faire les mêmes opérations en python ? J'ai essayé, np.where, groupby, transform et d'autres fonctions. Je les ai probablement combinées de la mauvaise manière.
Est-ce que quelqu'un pourrait m'aider ici, s'il vous plaît?