Est une Étoile de la conception d'un Schéma essentiel d'un entrepôt de données? Ou pouvez-vous faire d'entreposage de données avec un autre modèle?
Réponses
Trop de publicités?À l'aide de schémas en étoile, d'un entrepôt de données système vous procure plusieurs avantages, et dans la plupart des cas, il convient de les utiliser pour la couche supérieure. Vous pouvez également avoir un magasin de données opérationnelles (ODS) - normalisé structure qui dit "état actuel" et facilite les opérations telles que les données de la conformation. Cependant il existe des situations où ce n'est pas souhaitable. J'ai eu l'occasion de construire des systèmes avec et sans ODS couches, et avait des raisons particulières pour le choix de l'architecture dans chaque cas.
Sans entrer dans le subtlties de l'entrepôt de données de l'architecture ou de départ d'un Kimball vs Inmon flamme de guerre, les principaux avantages d'un schéma en étoile sont:
La plupart des systèmes de gestion de base de données ont des installations de la requête de l'optimiseur pour faire des Étoiles de Transformations " qui utilisation Bitmap Index des structures ou L'indice d'Intersection rapide prédicat de la résolution. Cela signifie que la sélection d'un schéma en étoile peut être fait sans frapper la table de faits (ce qui est généralement beaucoup plus grand que l'index) jusqu'à ce que la sélection est résolu.
Le partitionnement d'un schéma en étoile est relativement simple, puisque seulement la table de faits doit être partitionné (sauf si vous avez une bible, de grandes dimensions). Partition élimination signifie que l'optimiseur de requête peut ignorer patitions qui ne pouvait pas participer dans les résultats de la requête, ce qui permet d'économiser sur les I/O.
Les dimensions à évolution lente sont beaucoup plus faciles à mettre en œuvre sur un schéma en étoile qu'un flocon de neige.
Le schéma est plus facile à comprendre et a tendance à comporter moins de jointures qu'un flocon de neige ou E-R de schéma. Votre équipe de communication vont vous aimer pour ce
Des schémas en étoile sont beaucoup plus faciles à utiliser et (plus important encore) faire effectuer bien avec de requêtes ad-hoc des outils tels que Business Objects ou Générateur de Rapports. En tant que développeur, vous avez très peu de contrôle sur le SQL généré par ces outils vous avez besoin pour donner à la requête de l'optimiseur d'autant d'aide que possible. Des schémas en étoile donner à la requête de l'optimiseur de relativement peu d'occasions de se tromper.
En général, votre déclaration couche serait d'utiliser des schémas en étoile, sauf si vous avez une raison de ne pas. Si vous avez plusieurs systèmes sources, vous pouvez mettre en œuvre un Magasin de Données Opérationnelles avec normalisé ou schéma en flocon d'accumuler les données. C'est plus facile parce que l'ODS ne dispose généralement pas d'histoire. Historique de l'état est suivi dans des schémas en étoile, où c'est beaucoup plus facile à faire qu'avec des structures normalisées. Normalisé ou en flocons Magasin de Données Opérationnelles reflète 'état actuel et de ne pas tenir d'un point de vue historique et au dessus de tout ce qui est inhérent dans les données.
ODS charge les processus sont concernés par le nettoyage des données et de conformité, ce qui est plus facile à faire avec une structure normalisée. Une fois que vous avez nettoyer les données dans un ODS, de la dimension et de fait, les charges peuvent suivre l'histoire (les changements au fil du temps) avec des génériques ou relativement simples mécanismes relativement simple, ce qui est beaucoup plus facile à faire avec un schéma en étoile, de Nombreux outils ETL (par exemple) intégré dans des installations pour les dimensions à évolution lente et la mise en œuvre d'un mécanisme générique est relativement simple.
Superposition le système de cette façon provdies une séparation des responsabilités - et le nettoyage de données logique est traitée dans l'ODS et le schéma en étoile charges de traiter avec historique d'état.
Il y a un débat en cours dans le datawarehousing littérature à ce sujet où dans le datawarehouse-architecture de l' Étoile-Schéma de conception doivent être appliquées.
En bref Kimball défenseurs de la très fortement pour l'aide seulement de l'Étoile de la conception d'un Schéma dans le datawarehouse, tandis que Inmon premier veut construire une Entreprise Datawarehouse utilisation normalisées 3FN de la conception et de l'utilisation ultérieure de l'Étoile-la conception d'un Schéma dans les datamarts.
En plus ici, on pourrait aussi dire que la conception de schéma en Flocon est une autre approche.
Une quatrième conception pourrait être le Data Vault Modélisation de l' approche.
Des schémas en étoile sont utilisés pour permettre l'accès au haut débit de gros volumes de données. La haute performance est activée par la réduction de la quantité de jointures nécessaires pour satsify toute requête qui peut être faite à l'encontre de l'objet de la zone. Ceci est fait en permettant la redondance des données dans des tables de dimension.
Vous devez vous rappeler que le schéma en étoile est un modèle de la couche supérieure de l'entrepôt. Tous les modèles sont également impliquer la mise en scène des schémas au fond de l'entrepôt de la pile, et certaines comprennent également une persistant transformé fusionné zone de transit où tous les systèmes sources sont fusionnés en un 3FN modélisé schéma. Les divers domaines s'asseoir au-dessus de cette.
Des Alternatives aux schémas en étoile, au plus haut niveau comprennent une variation, qui est un schéma en flocon. Une nouvelle méthode qui peut supporter quelques recherches, ainsi que les Données de Voûte de la Modélisation proposée par Dan Linstedt.
La chose à propos de schémas en étoile, c'est qu'ils sont un modèle naturel pour le genre de choses que la plupart des gens veulent faire avec un entrepôt de données. Par exemple, il est facile de produire des rapports avec différents niveaux de granularité (de jours ou de mois ou de l'année par exemple). Il est également efficace pour insérer entreprise type de données dans un schéma en étoile, encore une fois une commune et caractéristique importante de l'entrepôt de données.
Vous pouvez certainement utiliser n'importe quel type de base de données que vous souhaitez mais si vous connaissez votre domaine d'affaires très bien, il est probable que vos rapports ne fonctionne pas aussi efficacement qu'ils le pourraient si vous aviez utilisé un schéma en étoile.
Des schémas en étoile sont un choix naturel pour la dernière couche d'un entrepôt de données. Comment obtenir il est une autre question. Autant que je sache, il y a deux camps, ceux de projet de Loi Inmon et Ralph Kimball. Vous voudrez peut-être consulter les théories de ces deux gars si/lorsque vous décidez d'aller avec une étoile.
En outre, certains outils de reporting vraiment comme l'étoile du schéma de configuration. Si vous êtes enfermé dans un rapport spécifique de l'outil, qui pourrait conduire que la déclaration mart ressemble dans votre entrepôt.