Comment fonctionnent les bases de données colonnaires ?
La base de données colonnaire est une concept plutôt un architecture/implémentation . En d'autres termes, il n'existe pas de description particulière du fonctionnement de ces bases de données ; en effet, plusieurs d'entre elles sont construites sur la base de SGBD traditionnels, orientés ligne, qui stockent simplement les informations dans des tables à une (ou plutôt deux) colonne(s) (et ajoutent la couche nécessaire pour accéder facilement aux données en colonne).
En quoi diffèrent-elles des bases de données relationnelles ? Elles diffèrent généralement des bases de données traditionnelles (orientées lignes) en ce qui concerne ...
- performance...
- les besoins de stockage ...
- facilité de modification du schéma ...
...dans des cas d'utilisation spécifiques des SGBD .
Ils offrent notamment des avantages dans les domaines mentionnés lorsque l'utilisation typique consiste à calculer des valeurs agrégées sur un nombre limité de colonnes, plutôt que d'essayer de récupérer toutes/la plupart des colonnes pour une entité donnée.
Existe-t-il une version d'essai d'une base de données columnar que je peux installer pour m'amuser ? (Je suis sous Windows 7) Oui, il existe des implémentations commerciales, gratuites et également open-source des bases de données colonnaires. Voir la liste à la fin de l'article Article de Wikipedia pour le démarrage.
Sachez que plusieurs de ces implémentations ont été introduites pour répondre à un besoin particulier (par exemple, une très petite empreinte, une distribution hautement compressible des données, ou une émulation de matrice de rechange, etc.) plutôt que de fournir un SGBD orienté colonnes à usage général en soi.
Note : La remarque sur "l'orientation à but unique" de plusieurs SGBD en colonnes n'est pas une critique de ces implémentations, mais plutôt une indication supplémentaire qu'une telle approche pour les SGBD s'éloigne de l'approche plus "naturelle" (et certainement plus largement utilisée) du stockage des entités d'enregistrement. En conséquence, cette approche est utilisée lorsque l'approche orientée ligne n'est pas satisfaisante, et tend donc à
a) sont ciblés dans un but particulier b) reçoivent moins de ressources/intérêt que les travaux sur l'approche tabulaire "à usage général", "testée et éprouvée".
A titre indicatif, le Entité-Attribut-Valeur (EAV), peut constituer une stratégie de stockage alternative que vous pouvez envisager. Bien qu'il soit distinct du modèle de base de données colonnaire "pur", le modèle EAV partage plusieurs des caractéristiques des bases de données colonnaires.