Je voudrais définir une nouvelle colonne dans mon cadre de données. Cette nouvelle colonne prend une valeur dans l'une des deux autres colonnes. Une cellule donnée de la nouvelle.colonne ne doit échantillonner les cellules des autres colonnes que si celles-ci se trouvent sur la même ligne.
Ce que je veux :
first.column second.column new.column
---------------------------------------
a b a
c d d
Ici, nous échantillonnons first.column
y second.column
pour définir la nouvelle colonne. Nous avons choisi au hasard a
de la première ligne et d
de la deuxième rangée.
Voici ce que j'ai essayé jusqu'à présent :
set.seed(1)
first = sample(c('a', 'c'), 2)
second = sample(c('b', 'd'), 2)
my.tibble = tibble(first, second)
my.tibble = my.tibble %>%
mutate(
third = sample(c(first, second), 1)
)
my.tibble
# A tibble: 2 x 3
# first second third
# <chr> <chr> <chr>
# 1 a b b
# 2 c d b
On dirait que j'ai échantillonné la deuxième rangée deux fois.