J'ai un csv avec 2 colonnes : "Contexte", "Utterance".
J'ai besoin de mélanger (dans un ordre aléatoire) les valeurs de la colonne "Contexte". Notez que ce n'est pas toute la ligne qui doit être mélangée, mais seulement une colonne, l'ordre de la deuxième colonne "Utterance" reste le même.
Pour cela, j'ai utilisé : les réponses ( brassage/permutation d'un DataFrame dans pandas )
train_df2 = pd.read_csv("./data/nolabel.csv", encoding='utf-8', sep=",")
train_df2.drop('Utterance', axis=1, inplace=True) # delete 'Utterance'
train_df2 = train_df2.sample(frac=1) # shuffle
train_df2['Utterance'] = train_moscow_df['Utterance'] # add back 'Utterance'
train_df2["Label"] = 0
header = ["Context", "Utterance", "Label"] #
train_df2.to_csv('./data/label0.csv', columns = header, encoding='utf-8', index = False)
MAIS, le résultat est mauvais : j'ai obtenu un brassage complet des lignes, mais les valeurs correspondantes de 2 colonnes sont toujours les mêmes.
J'ai besoin que la première valeur de la première colonne corresponde à une valeur aléatoire de la deuxième colonne (j'ai aussi essayé). from sklearn.utils import shuffle
mais pas de chance non plus)