Application efficace d'une fonction à un DataFrame groupé de pandas en parallèle

Question

Application efficace d'une fonction à un DataFrame groupé de pandas en parallèle

Demandé el 30 de Juillet, 2012: Quand la question a-t-elle été
2301 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

J'ai souvent besoin d'appliquer une fonction à l'groupes d'une très grande DataFrame (mixte types de données) et voudrais profiter de plusieurs cœurs.

Je peux créer un itérateur de groupes et d'utiliser le module multiprocessing, mais il n'est pas efficace, car chaque groupe et les résultats de la fonction doit être nettoyée pour la messagerie entre les processus.

Est-il un moyen d'éviter le décapage ou même pour éviter la copie de la DataFrame complètement? Il ressemble à la mémoire partagée les fonctions du multitraitement modules sont limités à des tableaux Numpy. Existe-il d'autres options?

Demandé el 30 de Juillet, 2012 par user2303

Answer 1

1 Réponses

Answer 2

5voto

user3222893 Points 51

Essayez de lire ce numéro de github sur la parallélisation.

Répondu el 22 de Janvier, 2014 par user3222893 (51 Points )

Application efficace d'une fonction à un DataFrame groupé de pandas en parallèle

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Application efficace d'une fonction à un DataFrame groupé de pandas en parallèle

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: