La réponse courte à cette question est -
Hadoop - est un cadre qui facilite le système de fichiers distribués et le modèle de programmation qui nous permet de stocker des données de taille énorme et de traiter les données de manière distribuée très efficacement et avec un temps de traitement très court par rapport aux approches traditionnelles.
(HDFS - Système de fichiers distribués Hadoop) (Map Reduce - Modèle de programmation pour le traitement distribué)
Hive - Langage d'interrogation qui permet de lire/écrire des données à partir du système de fichiers distribué Hadoop d'une manière très populaire semblable à SQL. Cela a facilité la vie de nombreuses personnes n'ayant pas de formation en programmation, car elles n'ont plus à écrire de programme Map-Reduce, sauf dans des scénarios très complexes où Hive n'est pas pris en charge.
Hbase - Est une base de données NoSQL colonnaire. La couche de stockage sous-jacente de Hbase est à nouveau HDFS. Le cas d'utilisation le plus important pour cette base de données est de pouvoir stocker des milliards de lignes avec des millions de colonnes. La fonction de faible latence de Hbase permet un accès plus rapide et aléatoire des enregistrements sur des données distribuées, ce qui est une caractéristique très importante pour la rendre utile pour des projets complexes comme les moteurs de recommandation. De plus, la capacité de versionnage au niveau de l'enregistrement permet à l'utilisateur de stocker très efficacement des données transactionnelles (ce qui résout le problème de la mise à jour des enregistrements que nous rencontrons avec HDFS et Hive).
J'espère que cela vous aidera à comprendre rapidement les trois fonctions ci-dessus.
0 votes
Hadoop : Système de fichiers distribués Hadoop + Modèle de traitement informatique MapReduce. HBase : Stockage clé-valeur, bon pour la lecture et l'écriture en quasi temps réel. Ruche : Utilisé pour l'extraction de données à partir du HDFS en utilisant une syntaxe de type SQL. Cochon : est un langage de flux de données pour la création d'ETL.