En utilisant le paquet tidytext, je veux transformer mon tibble en un token par document par ligne. J'ai transformé la colonne de texte de mon tibble de facteur en caractère mais j'obtiens toujours la même erreur.
text_df <- tibble(line = 1:3069, text = text)
Mon tibble ressemble à ceci, avec une colonne comme caractère :
# A tibble: 3,069 x 2
line text$text
<int> <chr>
Cependant, lorsque j'essaie d'appliquer unnest_tokens :
text_df %>%
unnest_tokens(word, text$text)
Je reçois toujours la même erreur :
Erreur dans check_input(x) : L'entrée doit être un vecteur de caractères de n'importe quelle longueur ou une liste de vecteurs de caractères, chacun ayant une longueur de 1. de caractères, chacun d'entre eux ayant une longueur de 1.
Quel est le problème dans mon code ?
PS : J'ai consulté différents articles sur le sujet, mais sans succès.
Merci.