R définit un ~
(tilde) à utiliser dans les formules. Les formules ont toutes sortes d'utilisations, mais la plus courante est sans doute celle de la régression :
library(datasets)
lm( myFormula, data=iris)
help("~")
ou help("formula")
vous en apprendra davantage.
@Spacedman a couvert les bases. Voyons comment cela fonctionne.
Tout d'abord, s'agissant d'un opérateur, notez qu'il s'agit essentiellement d'une raccourci vers une fonction (avec deux arguments) :
> `~`(lhs,rhs)
lhs ~ rhs
> lhs ~ rhs
lhs ~ rhs
Il peut être utile de le savoir pour l'utiliser, par exemple, dans les cas suivants apply
les commandes de la famille.
Deuxièmement, vous pouvez manipuler la formule en tant que texte :
oldform <- as.character(myFormula) # Get components
myFormula <- as.formula( paste( oldform[2], "Sepal.Length", sep="~" ) )
Troisièmement, vous pouvez le manipuler en tant que liste :
myFormula[[2]]
myFormula[[3]]
Enfin, il existe quelques astuces utiles avec les formules (voir help("formula")
pour en savoir plus) :
myFormula <- Species ~ .
Par exemple, la version ci-dessus est la même que la version originale, puisque le point signifie "toutes les variables non encore utilisées". Cette version examine le data.frame que vous utilisez dans votre appel de modèle éventuel, voit quelles variables existent dans le data.frame mais ne sont pas explicitement mentionnées dans votre formule, et remplace le point par ces variables manquantes.
0 votes
Vous pouvez partager le lien vers le tutoriel ? Cela semble intéressant.
1 votes
@cheeesus...J'ai parcouru l'ebook data mining in R with case studies...vous pouvez y trouver beaucoup d'autres exemples aussi intéressants.