237 votes

Comment charger un fichier tsv dans un DataFrame Pandas ?

Je suis novice en matière de python et de pandas. J'essaie d'obtenir un tsv chargé dans un fichier pandas DataFrame .

Voici ce que j'essaie de faire et l'erreur que j'obtiens :

>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))

Traceback (most recent call last):
  File "<pyshell#28>", line 1, in <module>
    df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
    raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!

17 votes

Pour ceux qui viennent à cette réponse en 2017+, utilisez read_csv('path_to_file', sep='\t') . Voir cette réponse ci-dessous

0 votes

Merci @TedPetrou

3voto

Đ.J vicky Points 31
data = pd.read_csv('your_dataset.tsv', delimiter = '\t', quoting = 3)

Vous pouvez utiliser un délimiteur pour séparer les données, quoting = 3 permet d'effacer les guillemets dans les données.

2voto

Jackson Points 11
df = pd.read_csv('filename.csv', sep='\t', header=0)

Vous pouvez charger le fichier tsv directement dans le cadre de données pandas en spécifiant le délimiteur et l'en-tête.

0voto

peaceloving Points 1

Essayez ça :

import pandas as pd
DataFrame = pd.read_csv("dataset.tsv", sep="\t")

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X