À partir d'un cadre de données comme celui-ci
test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10])
test <- test[order(test$id), ]
rownames(test) <- 1:10
> test
id string
1 1 A
2 1 F
3 2 B
4 2 G
5 3 C
6 3 H
7 4 D
8 4 I
9 5 E
10 5 J
Je veux en créer un nouveau avec la première ligne de chaque paire id/chaîne. Si sqldf acceptait du code R en son sein, la requête pourrait ressembler à ceci :
res <- sqldf("select id, min(rownames(test)), string
from test
group by id, string")
> res
id string
1 1 A
3 2 B
5 3 C
7 4 D
9 5 E
Existe-t-il une solution autre que la création d'une nouvelle colonne telle que
test$row <- rownames(test)
et en exécutant la même requête sqldf avec min(row) ?