203 votes

Quand utiliser Hadoop, HBase, Hive et Pig ?

Quels sont les avantages de l'utilisation Hadoop o HBase o Ruche ?

D'après ce que j'ai compris, HBase évite d'utiliser map-reduce et dispose d'un stockage orienté colonne au-dessus de HDFS. Ruche est une interface de type sql pour Hadoop y HBase .

J'aimerais également savoir comment Ruche se compare à Cochon .

0 votes

Hadoop : Système de fichiers distribués Hadoop + Modèle de traitement informatique MapReduce. HBase : Stockage clé-valeur, bon pour la lecture et l'écriture en quasi temps réel. Ruche : Utilisé pour l'extraction de données à partir du HDFS en utilisant une syntaxe de type SQL. Cochon : est un langage de flux de données pour la création d'ETL.

0voto

Nabeel Raza Points 13

Hadoop :

HDFS est l'acronyme de Hadoop Distributed File System, qui utilise le modèle de traitement informatique Map-Reduce.

HBase :

HBase est un stockage clé-valeur, bon pour la lecture et l'écriture en temps quasi réel.

Ruche :

Hive est utilisé pour l'extraction de données du HDFS en utilisant une syntaxe de type SQL. Hive utilise le langage HQL.

Cochon :

Pig est un langage de flux de données pour la création d'ETL. C'est un langage de script.

0voto

ebeb Points 31

Pig est pratiquement mort depuis que Cloudera l'a supprimé dans CDP. De plus, la dernière version d'Apache date du 19 juin 2017 : la version 0.17.0. Il n'y a donc plus de committers actifs. Utilisez Spark ou Python, bien plus puissants que Pig.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X