Comment écrire des jobs hadoop "map only" ?

Question

Comment écrire des jobs hadoop "map only" ?

Demandé el 22 de Février, 2012: Quand la question a-t-elle été
32539 affichage: Nombre de visites la question a
4 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je suis novice sur hadoop, je me familiarise avec le style de programmation map-reduce mais maintenant je suis confronté à un problème : parfois je n'ai besoin que de map pour un travail et je n'ai besoin que du résultat de la map directement en sortie, ce qui signifie réduire phase n'est pas nécessaire ici, comment puis-je y parvenir ?

Demandé el 22 de Février, 2012 par Breakinen

Answer 1

4 Réponses

Answer 2

59voto

Thomas Jungblut Points 11072

Cela désactive le réducteur.

 job.setNumReduceTasks(0);

http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapreduce/Job.html#setNumReduceTasks(int)

Répondu el 22 de Février, 2012 par Thomas Jungblut (11072 Points )

Answer 3

8voto

Peter Wippermann Points 968

Vous pouvez également utiliser IdentityReducer :

http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/mapred/lib/IdentityReducer.html

Répondu el 22 de Février, 2012 par Peter Wippermann (968 Points )

Answer 4

5voto

voo Points 3505

Peut être très utile lorsque vous devez lancer un travail avec des mappeurs uniquement à partir du terminal. Vous pouvez désactiver les réducteurs en spécifiant implicitement 0 réducteurs dans la commande hadoop jar :

 -D mapred.reduce.tasks=0

Ainsi, la commande de résultat sera la suivante :

 hadoop jar myJob.jar -D mapred.reduce.tasks=0 -input myInputDirs -output myOutputDir

Pour être rétrocompatible, Hadoop prend également en charge l'option "-reduce NONE", qui équivaut à "-D mapred.reduce.tasks=0".

Répondu el 8 de Mars, 2016 par voo (3505 Points )

Answer 5

0voto

Neha Kumari Points 304

Si vous utilisez oozie comme planificateur pour gérer vos tâches hadoop, vous pouvez simplement définir la propriété mapred.reduce.tasks (qui est le nombre par défaut de tâches de réduction par tâche) sur 0. Vous pouvez ajouter votre mappeur dans la propriété mapreduce .map.class, et il n'y aura pas non plus besoin d'ajouter la propriété mapreduce.reduce.class puisque les réducteurs ne sont pas nécessaires.

 <configuration>
   <property>
     <name>mapreduce.map.class</name>
     <value>my.com.package.AbcMapper</value>
   </property>
   <property>
     <name>mapred.reduce.tasks</name>
     <value>0</value>
   </property>
   .
   .
   .
<configuration>

Répondu el 1 de Juillet, 2018 par Neha Kumari (304 Points )

Comment écrire des jobs hadoop "map only" ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment écrire des jobs hadoop "map only" ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: