J'ai besoin de créer un cadre de données en lisant des données dans un fichier, en utilisant read_csv
méthode. Cependant, les séparateurs ne sont pas très réguliers : certaines colonnes sont séparées par des tabulations ( \t
), d'autres sont séparés par des espaces. En outre, certaines colonnes peuvent être séparées par 2 ou 3 espaces ou plus, voire par une combinaison d'espaces et de tabulations (par exemple 3 espaces, deux tabulations, puis 1 espace).
Existe-t-il un moyen d'indiquer à pandas de traiter ces fichiers correctement ?
Au fait, je n'ai pas ce problème si j'utilise Python. J'utilise :
for line in file(file_name):
fld = line.split()
Et ça fonctionne parfaitement. Il ne se soucie pas de savoir s'il y a 2 ou 3 espaces entre les champs. Même les combinaisons d'espaces et de tabulations ne posent aucun problème. Les pandas peuvent-ils faire de même ?