Mon parcours - 4 semaines dans le monde Hadoop. J'ai un peu tâté de Hive, Pig et Hadoop en utilisant la VM Hadoop de Cloudera. J'ai lu le document de Google sur Map-Reduce et GFS ( Lien PDF ).
Je comprends que
-
Le langage du cochon Le latin du cochon est un changement de (convient à la façon dont les programmeurs pensent) Le style de programmation déclaratif de type SQL déclaratif de programmation et le langage de requête de Hive ressemble beaucoup à SQL.
-
Pig se trouve au-dessus de Hadoop et, en principe, il peut également être installé au-dessus de Dryad. Je peux me tromper mais Hive est étroitement couplé à Hadoop.
-
Les commandes Pig Latin et Hive se compilent en tâches Map et Reduce.
Ma question - Quel est l'objectif d'avoir les deux quand un seul (disons Pig) pourrait faire l'affaire. Est-ce simplement parce que Pig est évangélisé par Yahoo ! et Hive par Facebook ?
27 votes
Hive est pour les données structurées . Pig est pour les données non structurées.
2 votes
Note pour les lecteurs actuels : Pig n'a pas connu beaucoup d'innovations et est considéré comme déprécié par beaucoup. La plupart des réponses ci-dessous ne reflètent pas cette situation car elles ont été écrites il y a quelque temps.