J'ai un jeu de données CSV qui ressemble à ceci :
Age;Functions;...
12;1,2,5;...
45;1,4,5,8;...
23;3;...
La première colonne est l'âge du participant et la deuxième colonne est une liste séparée par des virgules des réponses à choix multiple de la question 1. Dans cet exemple, le premier participant coche les cases 1, 2 et 5 et le troisième participant ne coche que la troisième case.
Maintenant, je veux évaluer les réponses à la question 1. La première étape consiste à tracer le nombre de réponses de chaque réponse possible. J'ai essayé ce qui suit :
dataset$Functions <- strsplit(as.character(dataset$Functions), ",", fixed=T)
dataset$Functions <- lapply(dataset$Functions, factor, levels = 0:8, labels=c(
"no answer",
"checkbox 1",
"checkbox 2",
"checkbox 3",
"checkbox 4",
"checkbox 5",
"checkbox 6",
"checkbox 7",
"checkbox 8",
))
Supplémentaire J'ai essayé d'utiliser mChoice :
library("Hmisc")
dataset$Functions <- lapply(dataset$Functions, mChoice, label="Functions")
Mais maintenant, je ne sais pas comment gérer la liste dans le dataframe. Avez-vous une idée ?