Étant donné deux cadres de données :
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1)))
df1
# CustomerId Product
# 1 Toaster
# 2 Toaster
# 3 Toaster
# 4 Radio
# 5 Radio
# 6 Radio
df2
# CustomerId State
# 2 Alabama
# 4 Alabama
# 6 Ohio
Comment puis-je faire du style base de données, c'est-à-dire, style sql, jointures ? C'est-à-dire, comment puis-je obtenir :
- Un jointure intérieure de
df1
ydf2
:
Renvoie uniquement les lignes dans lesquelles la table de gauche a des clés correspondantes dans la table de droite. - Un jointure extérieure de
df1
ydf2
:
Renvoie toutes les lignes des deux tables, en joignant les enregistrements de gauche qui ont des clés correspondantes dans la table de droite. - A jointure externe gauche (ou simplement jointure gauche) de
df1
ydf2
Renvoie toutes les lignes de la table de gauche, et toutes les lignes avec des clés correspondantes de la table de droite. - A jointure externe droite de
df1
ydf2
Renvoie toutes les lignes de la table de droite, et toutes les lignes avec des clés correspondantes de la table de gauche.
Un crédit supplémentaire :
Comment puis-je faire une instruction de sélection de style SQL ?
4 votes
stat545-ubc.github.io/bit001_dplyr-cheatsheet.html ma réponse préférée à cette question
0 votes
L'aide-mémoire Data Transformation with dplyr créé et maintenu par RStudio contient également de belles infographies sur le fonctionnement des jointures dans dplyr. rstudio.com/ressources/cheatsheets
3 votes
Si vous êtes venu ici pour vous renseigner sur la fusion pandas cette ressource peut être trouvée aquí .
1 votes
Pour le lien @isomorphismes, voici une version archivée actuelle : web.archive.org/web/20190312112515/http://stat545.com/…