Choisir ce que l'on utilise
Grande table
Google BigTable est la solution de stockage en nuage de Google pour l'accès aux données à faible latence. Elle a été développée à l'origine en 2004 et a été construite sur le système de fichiers de Google (GFS). Il existe un article sur BigTable : Bigtable : Un système de stockage distribué pour les données structurées. Aujourd'hui, il est largement utilisé dans de nombreux services de base de Google comme Google Search, Google Maps et Gmail. Il est conçu dans une architecture NoSQL, mais peut toujours utiliser le format de données par ligne. Avec des lectures/écritures de données inférieures à 10 millisecondes, il est idéal pour les applications qui ingèrent fréquemment des données. Il peut être adapté à des centaines de pétaoctets et gérer des millions d'opérations par seconde.
BigTable est compatible avec l'API HBase 1.0 via des extensions. Toute migration depuis HBase sera plus facile. BigTable n'a pas d'interface SQL et vous pouvez seulement utiliser l'API pour mettre/obtenir/supprimer des lignes individuelles ou exécuter des opérations de balayage. BigTable peut être facilement intégré à d'autres outils GCP, comme Cloud Dataflow et Dataproc. BigTable est également la base de Cloud Datastore.
Contrairement à d'autres nuages, le calcul et le stockage de GCP sont séparés. Vous devez prendre en compte les trois éléments suivants pour calculer le coût. 1. Le type d'instance de cloud, et le nombre de nœuds dans l'instance. 2. La quantité totale de stockage que vos tables utilisent. 3. La quantité de bande passante réseau utilisée. Veuillez noter qu'une partie du trafic réseau est gratuite.
C'est bon et mauvais. L'avantage est que vous n'avez pas besoin de payer le coût de calcul si votre système est inactif et que vous ne payez que le coût de stockage. L'inconvénient est qu'il n'est pas facile de prévoir l'utilisation de l'ordinateur si vous avez un très grand ensemble de données.
BigQuery
BigQuery est la solution d'entreposage de données basée sur le cloud de Google. Contrairement à BigTable, elle cible les données dans leur ensemble et peut interroger d'énormes volumes de données en peu de temps. Comme les données sont stockées dans un format de données en colonnes, il est beaucoup plus rapide d'analyser de grandes quantités de données par rapport à BigTable. BigQuery vous permet de passer au pétaoctet et constitue un excellent entrepôt de données d'entreprise pour l'analyse. BigQuery est sans serveur. L'informatique sans serveur signifie que les ressources informatiques peuvent être utilisées à la demande. Il permet aux utilisateurs de passer d'une utilisation zéro du serveur à une utilisation à grande échelle sans impliquer les administrateurs et la gestion de l'infrastructure. Selon Google, BigQuery peut analyser des téraoctets de données en quelques secondes et des pétaoctets de données en quelques minutes. Pour l'ingestion de données, BigQuery permet de charger des données à partir de Google Cloud Storage, ou de Google Cloud DataStore, ou de flux dans le stockage BigQuery.
Cependant, BigQuery est vraiment destiné aux requêtes de type OLAP et à l'analyse de grandes quantités de données et n'est pas conçu pour les requêtes de type OLTP. Pour de petites lectures/écritures, il faut environ 2 secondes alors que BigTable prend environ 9 millisecondes pour la même quantité de données. BigTable est bien mieux adapté aux requêtes de type OLTP. Bien que BigQuery supporte les opérations atomiques sur une seule rangée, il ne supporte pas les transactions inter-rangées.
Voir ces informations pour plus d'informations Lien 1 Lien 2 `` Lien 3
0 votes
Je dirais que BigTable s'apparente davantage à un Datastore en nuage de bas niveau et moins géré pour les personnes qui ont besoin de meilleures performances.
2 votes
Cet ancien fil de discussion sur le SO peut également vous aider : stackoverflow.com/questions/34437572/
0 votes
@dyeray Oui, je le sais, mais y a-t-il une raison pour que quelqu'un maintienne les mêmes données dans BigTable et BigQuery plutôt que dans BigQuery uniquement ?
0 votes
BigTable est très efficace pour les recherches sur une seule ligne ou sur une petite plage. BigQuery est très bon pour la vue d'ensemble. Si vous voulez des analyses avec un forage efficace, vous utilisez BigQuery pour les analyses à grande échelle, et BigTable pour les analyses sur de petites plages.
0 votes
Comparaison des propriétés du système Google BigQuery vs. Google Cloud Bigtable vs. Google Cloud Datastore. ! image (Disclaimer ! Copié de db-engines.com)
0 votes
BigQuery est un entrepôt de données d'entreprise pour de grandes quantités de données relationnelles structurées. Bigtable est une base de données NoSQL à colonnes larges optimisée pour les lectures et écritures lourdes. cloud.google.com/blog/topics/developers-practitioners/