Comme le titre l'indique, j'essaie d'obtenir un dataframe dont les lignes sont répétées. Le facteur qui détermine les N répétitions à effectuer est basé sur la longueur des valeurs uniques d'une colonne spécifique présente dans le cadre de données original. Une fois le processus de répétition effectué, j'aimerais créer une nouvelle colonne qui applique toutes les mêmes valeurs uniques de la colonne spécifique du cadre de données d'origine à chaque nouvelle ligne créée.
Je sais que c'est un peu confus, mais je ne peux pas essayer d'exposer mes doutes d'une meilleure façon. Ainsi, pour faciliter votre compréhension de l'approche que je souhaite adopter, voici un bref exemple de mon dataframe et du dataframe de sortie souhaité :
>> Original Dataframe
Samp Age Cs
1 A 51 msi
2 B 62 cin
3 C 55 msi
4 D 70 ebv
5 E 56 gs
....
Comme vous pouvez le constater, mon Cs a 4 valeurs uniques (qui peuvent ne pas être les mêmes pour différents cadres de données). Mon objectif est donc d'obtenir un cadre de données ayant la structure suivante :
>> Desired Dataframe
Samp Age Cs
1 A 51 msi
1 A 51 cin
1 A 51 ebv
1 A 51 gs
2 B 62 cin
2 B 62 msi
2 B 62 gs
2 B 62 ebv
3 C 55 msi
3 C 55 cin
3 C 55 ebv
3 C 55 gs
4 D 70 ebv
4 D 70 cin
4 D 70 msi
4 D 70 gs
5 E 56 gs
5 E 56 cin
5 E 56 msi
5 E 56 ebv
....
Comme vous pouvez le voir, dans le cadre de données souhaité, toutes les lignes ont été répétées 4 fois (ce qui correspond au nombre de lignes uniques dans le cadre de données). Cs ) à l'exception des valeurs de la colonne Cs (qui applique toutes ses valeurs uniques à différentes lignes).