Grand DataFrame persistant dans pandas

Question

Grand DataFrame persistant dans pandas

Demandé el 24 de Juillet, 2012: Quand la question a-t-elle été
11004 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

En tant qu'utilisateur de longue date de SAS, j'envisage de passer à python et à pandas.

Cependant, lors de l'exécution de certains tests aujourd'hui, j'ai été surpris de constater que python manquait de mémoire lorsqu'il essayait de pandas.read_csv() un fichier csv de 128mb. Il comportait environ 200 000 lignes et 200 colonnes de données essentiellement numériques.

Avec SAS, je peux importer un fichier csv dans un ensemble de données SAS et celui-ci peut être aussi grand que mon disque dur.

Y a-t-il quelque chose d'analogue dans pandas ?

Je travaille régulièrement avec des fichiers volumineux et je n'ai pas accès à un réseau informatique distribué.

Demandé el 24 de Juillet, 2012 par Zelazny7

0 votes

Je ne suis pas familier avec pandas, mais vous pourriez envisager d'itérer dans le fichier. pandas.pydata.org/pandas-docs/stable/

Commenté el 24 de Juillet, 2012 par monkut

Answer 1

1 Réponses

Answer 2

1voto

Elm662 Points 144

Vous pouvez utiliser Pytable plutôt que pandas df. Il est conçu pour les grands ensembles de données et le format de fichier est en hdf5. Le temps de traitement est donc relativement rapide.

Répondu el 10 de Février, 2017 par Elm662 (144 Points )

Grand DataFrame persistant dans pandas

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Grand DataFrame persistant dans pandas

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: