Comment augmenter le nombre de mappeurs dans Mahout MatrixMultiplicationJob ?

Question

Comment augmenter le nombre de mappeurs dans Mahout MatrixMultiplicationJob ?

Demandé el 4 de Octobre, 2012: Quand la question a-t-elle été
841 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'utilise la version 0.7 de Mahout. MatrixMultiplicationJob pour multiplier une grande matrice. Mais il utilise toujours une tâche de carte, ce qui le rend lent. InputSplit qui force le nombre de mappeurs à être 1.

Existe-t-il un moyen de multiplier efficacement les matrices dans Hadoop / Mahout ou de modifier le nombre de mappeurs ?

Demandé el 4 de Octobre, 2012 par Satish Verma

Answer 1

2 Réponses

Answer 2

3voto

Sean Owen Points 36577

En définitive, c'est Hadoop qui décide du nombre de mappeurs à utiliser. En général, il utilisera un mappeur par bloc HDFS (typiquement 64 ou 128MB). Si vos données sont plus petites que cela, elles sont trop petites pour s'embêter avec plus d'un mappeur.

Vous pouvez l'encourager à en utiliser davantage de toute façon en définissant les paramètres suivants mapred.max.split.size à quelque chose de plus petit que 64MB (rappelez-vous que la valeur est définie en octets, pas en MB). Mais, êtes-vous sûr de vouloir le faire ? Il est beaucoup plus courant d'avoir besoin de plus de réducteurs, pas de mappeurs, puisque Hadoop n'en utilisera jamais plus d'un à moins que vous (ou votre travail) ne le lui demandiez.

Sachez également qu'Hadoop ne pourra pas utiliser plus d'un mappeur sur une même comprimé fichier. Donc si votre entrée est un énorme fichier compressé, il n'utilisera qu'un seul mappeur sur ce fichier. Vous pouvez cependant le diviser vous-même en plusieurs fichiers compressés plus petits.

Répondu el 4 de Octobre, 2012 par Sean Owen (36577 Points )

Answer 3

0voto

Alex Ott Points 14329

Avez vous essayé de spécifier le nombre de mappeurs via la ligne de commande avec -Dmapred.map.tasks=N option ? Je ne l'ai pas essayée, mais elle devrait fonctionner. Si cela ne fonctionne pas, essayez alors de définir ce paramètre dans l'option MAHOUT_OPTS variable d'environnement...

Répondu el 4 de Octobre, 2012 par Alex Ott (14329 Points )

Comment augmenter le nombre de mappeurs dans Mahout MatrixMultiplicationJob ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment augmenter le nombre de mappeurs dans Mahout MatrixMultiplicationJob ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: