Ok, question stupide je sais, mais je vois la nébuleuse commentaire 'une grande base de données' ainsi que de petites et moyennes et je me demande ce que cela signifie. Quelqu'un peut-il définir ce qu'est une petite, de moyenne et de grande base de données est pour nous SQL néophytes?
Réponses
Trop de publicités?Il n'y a pas un seuil où une petite base de données devient moyen ou un moyen de la base de données devient importante. Généralement, quand j'entends ces conditions, je pense notamment à des ordres de grandeur en termes de nombre total d'enregistrements stockés.
- Petit: 105 ou moins d'enregistrements.
- Moyen: 105 107 dossiers.
- Grand: 107 109 dossiers.
- Très grand: 109 ou plus grand nombre de dossiers.
Comme l'affiche le dorfier suggéré, vous pouvez aussi penser en termes de propriétés de chaque type de base de données. La catégorisation de cette façon, je dirais:
Petit: la Performance n'est pas une préoccupation. Vos requêtes fonctionnent très bien sans faire des optimisations spéciales. Vous ne voyez que le rendement marginal de différence lors de l'utilisation de la ligne de front des améliorations comme l'index.
Moyenne: Votre base de données a probablement une ou plusieurs personnes qui sont affectés à mi-temps pour son entretien et de soins. Ces gens prêtent attention à la base de données de santé, leur principale responsabilité administrative est d'empêcher inacceptable des problèmes de performances et de minimiser les temps d'arrêt.
Grande: qui a Probablement membre du personnel(s) dont le métier est de travailler sur la base de données et améliorer les performances, ainsi que assurez-vous que l'application des modifications n'entraînent pas de schéma de rupture au cours de la durée de vie de la base de données. Des mesures concernant la santé et l'état de la base de données sont surveillés de près. Grande expertise est nécessaire de comprendre et de procéder à des optimisations.
Très important: La base de données stocke de grandes quantités d'informations qui doivent être facilement accessibles. L'optimisation des performances absolument nécessaire de tordre chaque dernière once de vitesse de chacune des requêtes, et sans elle, la base de données serait beaucoup moins utilisable, voire impossible. La base de données peut être sophistiquée ou innovantes de la réplication ou de techniques de clustering, repoussant les limites de la technologie actuelle.
Notez que ces derniers sont totalement subjectives, et que quelqu'un peut très bien avoir parfaitement légitime suppléant de la définition de "grand".
Une façon de comprendre c'est par l'observation de vos requêtes de test.
Une petite base de données en est une où les indices n'ont pas d'importance.
Un moyen de base de données en est une où les requêtes prendre plus d'une seconde si vous n'avez pas un indice approprié en place.
Une grosse base de données en est une où les requêtes souvent prendre des heures à optimiser, en utilisant une combinaison de la structure de la requête, l'indice de modification, et de nombreux cycles de test.
Meilleure réponse, les mains vers le bas: grande base de données sont celles que la force vous devez vous arrêter à l'aide de bases de données relationnelles.
En d'autres termes, un normalisée, base de données relationnelle où tous les indices dans le monde ne peuvent pas vous aider à répondre à vos exigences de temps de réponse en raison de l'entrée massive des Jointures.
Si vous avez déjà eu à abandonner les bases de données relationnelles pour quelque chose d'autre, soit vous êtes un mauvais développeur de base de données, n'ont pas d'expert DBA, ou avoir une très grande base de données.
"Grande Base de données" est en effet une notion nébuleuse. Il y a déjà des réponses très différentes et les avis postés par les réponses à cette question. Quelques approches pour définir le "petit", "moyen" et "grand" Bases de données peuvent faire plus de sens que les autres, MAIS ALORS, à un certain point, je considère que chaque définition est juste, vrai et valide.
Certaines définitions ont plus de sens que les autres parce qu'ils se concentrent sur différents aspects de l'importance pour la conception, la programmation, l'utilisation, la maintenance et l'administration d'une Base de données et ces différents aspects sont ce qui importe vraiment pour une Base de données utilisable. Il se trouve que tous ces aspects sont touchés par le nébuleux concept de "taille de Base de données".
Donc, est-ce à dire qu'il n'a pas d'importance si vous êtes en mesure de définir si une Base de données particulière est grand ou pas?
Certainement pas. Ce que cela signifie est que vous allez appliquer le concept différemment, en évaluant les différentes conception/exploitation/aspects administratifs de votre Base de données. Cela signifie aussi que chaque fois que ce concept sera nébuleux.
À titre d'exemple: Base de données de l'Indice de stratégie (un aspect de la conception de Base de données) est influencé par le nombre d'enregistrements de chaque table (une mesure de la "taille"), par taille d'enregistrement des fois le nombre d'enregistrement (une autre mesure de la "taille"), et par Requête Vs. Création/mise à Jour/Supprimer des opérations ratio d'aspect de l'utilisation de Base de données).
Temps de réponse des requêtes sont mieux si les index sont utilisés pour les tables avec une grande quantité de documents. Selon la nature de votre where, ORDER BY et la tenue de l'agrégation des clauses que vous pourriez avoir besoin de plusieurs indices pour certaines tables.
Création, mise à Jour et de Supprimer des opérations sont affectés négativement avec l'augmentation du nombre d'index dans la table affectée(s). Plusieurs index pour une table affectée signifie plus de changements que le SGBD doit effectuer, passer plus de temps et plus de ressources pour appliquer ces modifications.
Aussi, si votre SGBDR passe le plus de temps pour appliquer ces modifications, puis les serrures sont conservées pour des durées plus longues aussi, un impact sur le temps de réponse d'autres requêtes envoyées au système en même temps.
Alors, Comment faites-vous l'équilibre entre la quantité et la conception de votre index? Comment savez-vous si vous avez besoin d'un index supplémentaire et si en ajoutant que l'index ne sera pas l'introduction d'un impact négatif important sur les temps de réponse des requêtes? Réponse: Vous test de profil et de votre base de données contre une cible en charge par votre chargement/exigences de performance et d'analyser les données de profilage afin de découvrir si d'autres optimisations/refontes/indices sont nécessaires.
Différentes stratégies d'Index sont nécessaires pour les différents Requête Vs. Création/mise à Jour/Supprimer des opérations de ratios. Si votre Base de données est sous une charge lourde d'interrogations, mais est rarement mis à jour, les performances de l'ensemble de l'application sera mieux si vous ajoutez tous les index qui améliore les temps de réponse des requêtes. D'autre part, si votre Base de données est constamment mise à jour, mais il n'y a pas de grandes opérations de requête, puis le rendement sera meilleur si vous utilisez moins d'index.
Il y a d'autres aspects de la formation: Schéma de Base de données de conception, Stratégie de Stockage, la conception du Réseau, stratégie de Sauvegarde, Procédures Stockées/Triggers/Etc. la programmation, la Programmation d'Applications (sur la Base de données), Etc. Tous ces aspects sont touchés différemment par différents concepts de "size" (taille d'enregistrement, le nombre d'enregistrement, la taille de l'index, l'index, le comte, la conception d'un schéma, la taille de stockage, etc.).
J'aimerais avoir plus de temps que ce sujet est passionnant. J'espère que cette modeste contribution sert de point de départ pour vous dans ce monde fascinant de SQL.
Vous avez de compte pour le matériel de l'avancement de cette définition:
Petite base de données: ensemble de travail s'inscrit dans la mémoire RAM physique d'un produit de base unique serveur (environ 16 GO maintenant)
Moyen de la base de données: s'intègre dans un seul ou plusieurs (par le biais de RAID) des produits de base de disques durs sur une seule machine (jusqu'à plusieurs Sct maintenant)
Grande base de données: les Données doivent distribués sur plusieurs serveurs standard afin d'ajustement (jusqu'à plusieurs PBs maintenant.)