Je ne sais pas s'il est correct de dire "normaliser" une chaîne de variables catégorielles, mais en gros, je veux créer une fonction pour mettre toutes les observations F ou f de la colonne ci-dessous à 0 et M ou m à 1 :
> df['gender']
gender
f
F
f
M
M
m
J'ai essayé ça :
def padroniza_genero(x):
if(x == 'f' or x == 'F'):
replace(['f', 'F'], 0)
else:
replace(1)
df1['gender'] = df1['gender'].apply(padroniza_genero)
Mais j'ai eu une erreur :
NameError: name 'replace' is not defined
Des idées ? Merci !