J'ai un dataframe avec >100 colonnes, et je voudrais trouver les lignes uniques en ne comparant que deux des colonnes. J'espère que c'est facile, mais je n'arrive pas à le faire fonctionner moi-même avec unique
ou duplicated
.
Dans l'exemple ci-dessous, je voudrais obtenir les valeurs uniques uniquement en utilisant id
et id2
:
data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))
id id2 somevalue
1 1 x
1 1 y
3 4 z
Je voudrais obtenir soit:
id id2 somevalue
1 1 x
3 4 z
ou:
id id2 somevalue
1 1 y
3 4 z
(Je n'ai pas de préférence pour quelle ligne unique est gardée)