J'ai toujours pensé que les bases de données devraient être dénormalisées pour les performances de lecture, comme cela est fait pour la conception de bases de données OLAP, et ne pas exagérer beaucoup plus loin 3NF pour la conception OLTP.
PerformanceDBA dans différents postes, par exemple, dans Performances des différentes approches des données temporelles défend le paradigme selon lequel les bases de données doivent toujours être bien conçues par normalisation en 5NF et 6NF (forme normale).
L'ai-je bien compris (et qu'ai-je bien compris) ?
Qu'est-ce qui ne va pas avec l'approche traditionnelle de dénormalisation/paradigme de conception des bases de données OLAP (en dessous de 3NF) et le conseil que 3NF est suffisant pour la plupart des cas pratiques de bases de données OLTP ?
Par exemple :
Je dois avouer que je n'ai jamais pu saisir les théories selon lesquelles la dénormalisation facilite les performances de lecture. Quelqu'un peut-il me donner des références avec de bonnes explications logiques de ceci et des croyances contraires ?
Quelles sont les sources auxquelles je peux me référer lorsque j'essaie de convaincre mes interlocuteurs que les bases de données OLAP/entreposage de données doivent être normalisées ?
Pour améliorer la visibilité, j'ai copié ici des commentaires :
"Ce serait bien si les participants ajouteraient (divulgueraient) le nombre d'études de la vie réelle (pas d'études de projets scientifiques inclus) implémentations d'entrepôts de données en 6NF qu'ils ont vues ou auxquelles ils ont participé. Une sorte de pool rapide. Moi = 0." - Damir Sudarevic
Article sur les entrepôts de données de Wikipedia raconte :
"L'approche normalisée [par opposition à l'approche dimensionnelle de Ralph Kimball], également appelée la Modèle 3NF (Troisième Forme Normale) dont les partisans sont appelés " Inmonites ", croient en l'approche de Bill Inmon dans laquelle l'entrepôt de données doit être modélisé à l'aide d'un modèle E-R ou d'un modèle normalisé. modèle/normalisé".
Il semble que l'approche normalisée de l'entreposage des données (par Bill Inmon) soit perçue comme ne dépassant pas 3NF ( ?).
Je veux juste comprendre quelle est l'origine du mythe (ou de la croyance axiomatique omniprésente) selon lequel l'entreposage de données/OLAP est synonyme de dénormalisation ?
Damir Sudarevic répond qu'il s'agit d'une approche bien pavée. Permettez-moi de revenir à la question : Pourquoi croit-on que la dénormalisation facilite la lecture ?
3 votes
OLTP : normaliser, normaliser, normaliser...
6 votes
Il serait bien que les participants ajoutent (divulguent) le nombre d'implémentations réelles (sans projets scientifiques) d'entrepôts de données en 6NF qu'ils ont vues ou auxquelles ils ont participé. Une sorte de pool rapide. Moi = 0.
0 votes
@vgv8, ouf - vous avez pris la question initiale, qui est polarisée, puis l'avez affinée et modifiée avec les mises à jour ; il n'y a rien de mal à séparer "Quelles sont les sources auxquelles je peux me référer pour soutenir (afin de convaincre mes parties prenantes) que les bases de données OLAP/DataWareHousing devraient être normalisées ?" et "Qu'est-ce qui ne va pas avec l'approche traditionnelle de dénormalisation/la conception du paradigme des bases de données OLAP (en dessous de 3NF) ?". Bien que les sujets soient liés, il est beaucoup plus facile d'obtenir de bonnes réponses à des questions plus spécifiques.
0 votes
Le SGBDR est une chose, l'OLAP en est une autre. Le SGBDR doit être normalisé, l'OLAP n'est pas soumis à ces règles. Cependant, je n'aime pas les vues extrêmes de celui qui se fait appeler PerformanceDBA. Je pense que c'est un extrémiste qui va au-delà du bon sens et qui rend les choses exagérément compliquées sans bénéfice supplémentaire. (Je parle de ses théories anti "nulls").
2 votes
@iDevlop. 1) quelles sont vos qualifications techniques, et quelle est votre expérience en matière de production de bases de données à haute performance ? 2) Rejetez-vous toujours une personne entière en raison d'un désaccord avec un élément ? 3) Veuillez identifier quelle partie est "exagérément compliquée" pour vous, afin que je puisse souligner la valeur de cet élément. 4) Il est évident que vous n'avez pas lu The Null Problem et que vous ne savez donc pas que ce n'est pas ma théorie, ni quels sont les problèmes.
1 votes
@DamirSudarevic. Livraison d'un projet complet (à l'exclusion des missions de P&T, etc.) OLTP+quelques OLAP= 20. OLTP+OLAP complet = 4. OLAP = 2.