J'ai consulté plusieurs documents, mais je n'arrive pas à trouver la liste des avantages d'utilisation du cluster HDInsigths Spark par rapport au cluster Azure Databricks. Y a-t-il des différenciateurs clés entre ces deux solutions? J'ai essentiellement besoin de la liste des fonctionnalités supportées par HDInsights et non supportées par Azure Databricks.
Réponse
Trop de publicités?Laissez-moi vous emmener dans un voyage visuel et vous montrer quelques captures d'écran. J'ai attaché quelques captures d'écran pour Azure Spark et Azure Databricks. Azure Spark est un package HDInsight (Hortomwork HDP) sur Hadoop. Databricks est très différent lorsque vous lancez les services.
Vous devez choisir le nombre de nœuds et la configuration, et le reste des services sera configuré par les services Azure.
Si vous regardez l'instance Spark de HDInsight, elle aura les fonctionnalités suivantes. Référez-vous à ces 2 captures d'écran &&
- Apache Ranger
- Package de sécurité d'entreprise
- HDInsight IO Cache
- Accès Secure shell (SSH)
- Applications HDInsight
- Réseau virtuel personnalisé
- Hive metastore personnalisé
- Oozie metastore personnalisé
- Accès au stockage Data Lake Gen1
En revanche, Azure Spark est une abstraction complète et offre la fonctionnalité suivante sans aucune configuration. Choisissez la ressource et saisissez les informations de base, l'instance se lancera . Votre instance est opérationnelle . Votre plateforme est prête à être utilisée, . Tous vos notebooks, tutoriels, etc. sont disponibles et prêts à être utilisés. Vous n'avez pas besoin de penser à autre chose. Voici à quoi ressemblent vos ressources finales une fois l'instance databricks créée.
Les prix de databricks sont très différents et vous pouvez consulter les tarifs ici Liens Databricks pour les tarifs sont ici