J'ai un cadre de données avec 500 observations, mais je n'en montre que 3 dans mon exemple. Il s'agit de doublons avec des valeurs différentes dans différentes colonnes (sauf la colonne ID, qui comprend la personne doublée). Je reproduis le cadre de données tel qu'il est (df) et tel qu'il devrait être après traitement (df_new). Est-ce possible ? Le cadre de données est composé de 10 variables, je ne crains donc pas de les "doubler". Les valeurs des variables sont a,b,c,d,0,''. Je les ai cependant gardées plus générales dans les tableaux.
df <- data.frame(ID = c('1','1','2', '2', '3','3'),
Year = c('smaller year.1', 'bigger year.1', 'bigger year.2', 'smaller year.2', 'same year.3', 'same year.3'),
V1 = c('a', 'b','c','d','e','f'),
V2 = c('g', 'h', 'i', 'j', 'k', 'l'),
Vn = c('n1', 'n2','n3','n4','n5','n6'))
df_new <- data.frame(ID = c('1','2','3'),
Year_smaller = c('smaller year.1', 'smaller year.2', 'same year.3'),
Year_bigger = c('bigger year.1', 'bigger year.2', 'same year.3'),
V1 = c('a','c','e'),
V1.1 = c('b','d','f'),
V2 = c('g','i','k'),
V2.1 = c('h','j','l'),
Vn = c('n1','n3','n5'),
Vn.1 = c('n2','n4','n6'))