2 votes

Comment puis-je ajouter des étoiles à la sortie de la fonction tidy() du paquet Broom ?

J'ai utilisé les paquets de balais. tidy() dans R pour imprimer mes résumés de modèles.

Cependant, le tidy() renvoie les p-values sans étoile, ce qui est un peu bizarre pour de nombreuses personnes habituées à voir des étoiles dans les résumés de modèles.

Quelqu'un connaît-il un moyen d'ajouter des étoiles à la sortie ?

6voto

akrun Points 148302

Nous pouvons utiliser une fonction pratique stars.pval de gtools pour ce faire

library(gtools)
library(broom)
library(dplyr)
data(mtcars)
mtcars %>%
   lm(mpg ~ wt + qsec, .) %>%
   tidy %>%
   mutate(signif = stars.pval(p.value))
#        term  estimate std.error  statistic      p.value signif
#1 (Intercept) 19.746223 5.2520617   3.759709 7.650466e-04    ***
#2          wt -5.047982 0.4839974 -10.429771 2.518948e-11    ***
#3        qsec  0.929198 0.2650173   3.506179 1.499883e-03     **

5voto

neilfws Points 3881

Ce n'est pas vraiment le but de tidy . Il est utilisé pour créer des cadres de données ordonnés à partir de divers objets, et non pour fournir des métriques supplémentaires sur ces objets.

Vous pouvez toujours écrire une fonction pour générer des étoiles sur la base des valeurs p et ajouter une colonne au cadre de données généré à l'aide de la fonction tidy . Par exemple :

make_stars <- function(pval) {
  stars = ""
  if(pval <= 0.001)
    stars = "***"
  if(pval > 0.001 & pval <= 0.01)
    stars = "**"
  if(pval > 0.01 & pval <= 0.05)
    stars = "*"
  if(pval > 0.05 & pval <= 0.1)
     stars = "."
  stars
}

Alors quelque chose comme :

library(broom)
library(dplyr)

mtcars %>% 
  lm(mpg ~ wt + qsec, .) %>% 
  tidy() %>% 
  mutate(signif = sapply(p.value, function(x) make_stars(x)))

         term  estimate std.error  statistic      p.value signif
1 (Intercept) 19.746223 5.2520617   3.759709 7.650466e-04    ***
2          wt -5.047982 0.4839974 -10.429771 2.518948e-11    ***
3        qsec  0.929198 0.2650173   3.506179 1.499883e-03     **

1voto

Indrajeet Patil Points 1619

Cette question a déjà reçu une réponse, mais je voulais simplement signaler cette autre option qui est plus flexible que l'option de l'eau. gtools::stars.pval mentionné ci-dessus, car il renvoie un cadre de données ou un vecteur, en fonction de ce que vous avez choisi de saisir.

# loading the necessary library
library(broom)
library(dplyr)
library(groupedstats)

# using the function
mtcars %>%
  stats::lm(mpg ~ wt + qsec, .) %>%
  broom::tidy(.) %>%
  groupedstats::signif_column(data = ., p = p.value)

#> # A tibble: 3 x 6
#>   term        estimate std.error statistic  p.value significance
#>   <chr>          <dbl>     <dbl>     <dbl>    <dbl> <chr>       
#> 1 (Intercept)   19.7       5.25       3.76 7.65e- 4 ***         
#> 2 wt            -5.05      0.484    -10.4  2.52e-11 ***         
#> 3 qsec           0.929     0.265      3.51 1.50e- 3 **

0voto

David Points 3181

Tel qu'utilisé par le printCoefmat dans R, vous pouvez également utiliser la fonction symnum de la fonction stats (inclus dans la base r) :

pv <- c(0.00001, 0.002, 0.02, 0.06, 0.12, 0.99)

stars <- symnum(pv, corr = FALSE, na = FALSE, 
       cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1), 
       symbols = c("***", "**", "*", ".", " "))

# fetch the stars only
as.character(stars)
#> [1] "***" "**"  "*"   "."   " "   " "

# fetch the legend description
attr(stars, "legend")
#> [1] "0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1"

Créé le 2018-09-10 par le paquet reprex (v0.2.0).

Ou, pour répondre précisément à votre question, vous pouvez l'utiliser comme suit

library(dplyr)

pv <- c(0.00001, 0.002, 0.02, 0.06, 0.12, 0.99)

star_function <- function(x) {
  symnum(x, corr = FALSE, na = FALSE, 
         cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1), 
         symbols = c("***", "**", "*", ".", " "))
}
stars <- star_function(pv)

# fetch the stars only
as.character(stars)
#> [1] "***" "**"  "*"   "."   " "   " "

# fetch the legend description
attr(stars, "legend")
#> [1] "0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1"

mtcars %>%
  stats::lm(mpg ~ wt + qsec, .) %>%
  broom::tidy(.) %>% 
  mutate(sign = as.character(star_function(p.value)))
#> # A tibble: 3 x 6
#>   term        estimate std.error statistic  p.value sign 
#>   <chr>          <dbl>     <dbl>     <dbl>    <dbl> <chr>
#> 1 (Intercept)   19.7       5.25       3.76 7.65e- 4 ***  
#> 2 wt            -5.05      0.484    -10.4  2.52e-11 ***  
#> 3 qsec           0.929     0.265      3.51 1.50e- 3 **

Créé le 2018-09-10 par le paquet reprex (v0.2.0).

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X