2 votes

Comment augmenter le nombre de mappeurs dans Mahout MatrixMultiplicationJob ?

J'utilise la version 0.7 de Mahout. MatrixMultiplicationJob pour multiplier une grande matrice. Mais il utilise toujours une tâche de carte, ce qui le rend lent. InputSplit qui force le nombre de mappeurs à être 1.

Existe-t-il un moyen de multiplier efficacement les matrices dans Hadoop / Mahout ou de modifier le nombre de mappeurs ?

3voto

Sean Owen Points 36577

En définitive, c'est Hadoop qui décide du nombre de mappeurs à utiliser. En général, il utilisera un mappeur par bloc HDFS (typiquement 64 ou 128MB). Si vos données sont plus petites que cela, elles sont trop petites pour s'embêter avec plus d'un mappeur.

Vous pouvez l'encourager à en utiliser davantage de toute façon en définissant les paramètres suivants mapred.max.split.size à quelque chose de plus petit que 64MB (rappelez-vous que la valeur est définie en octets, pas en MB). Mais, êtes-vous sûr de vouloir le faire ? Il est beaucoup plus courant d'avoir besoin de plus de réducteurs, pas de mappeurs, puisque Hadoop n'en utilisera jamais plus d'un à moins que vous (ou votre travail) ne le lui demandiez.

Sachez également qu'Hadoop ne pourra pas utiliser plus d'un mappeur sur une même comprimé fichier. Donc si votre entrée est un énorme fichier compressé, il n'utilisera qu'un seul mappeur sur ce fichier. Vous pouvez cependant le diviser vous-même en plusieurs fichiers compressés plus petits.

0voto

Alex Ott Points 14329

Avez vous essayé de spécifier le nombre de mappeurs via la ligne de commande avec -Dmapred.map.tasks=N option ? Je ne l'ai pas essayée, mais elle devrait fonctionner. Si cela ne fonctionne pas, essayez alors de définir ce paramètre dans l'option MAHOUT_OPTS variable d'environnement...

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X