PRATIQUE ALGO/METHODES 
Expliquez-moi : les bases de données multidimensionnelles
 
Réservés aux entrepôts de données, les SGBD dimensionnels agrègent des informations en provenance de sources hétérogènes pour en tirer des tendances et soutenir les activités décisionnelles. (13/10/2006)
  Forum

Réagissez dans les forums de JDN Développeurs

La vaste majorité des activités de stockage et de traitement dynamique de données informatisées se fait aujourd'hui par le biais d'un modèle inventé dans les années 70 et baptisé "modèle rationnel".

"Satisfaction", par Kevin Labianco
Si le modèle de départ n'est plus guère suivi à la lettre, les grands principes ont été conservés et la plupart des SGBD actuels sont en réalité des SGBDR (Système de Gestion de base de données Relationnel, en anglais RDBMS pour Relational DataBase Management System). Ces grands principes sont la combinaison de clefs primaires et étrangères pour établir un lien entre tables, liens remontés par le biais de requêtes SQL.

Avec le besoin grandissant de stocker toujours plus de données et d'y accéder de manière toujours plus rapide et pertinente, de nouveaux modèles ont été développés, parmi lesquels le modèle multidimensionnel. La multidimensionnalité suppose ici qu'un tableau, tel que connu dans le modèle relationnel, a plusieurs dimensions, là où un tableau relationnel n'en a que deux (colonne, ligne).

Plutôt que de représenter les données sous forme de tableaux, le modèle multidimensionnel travaille avec plusieurs "axes", le plus souvent 3, formant ce qu'on appelle un hypercube. Pour prendre l'exemple d'une Rubik's Cube, chaque petit cube peut être défini par sa position en hauteur, longueur et profondeur. Dans un modèle multidimensionnel, un élément peut également être défini par plusieurs "catégories".

En réalité, une base multidimensionnelle est contenue dans une seule table, chaque cellule, ou "fait", étant par ailleurs caractérisée par une dimension (contexte du fait : type, date, lieu, groupe) et une mesure (quantité descriptive).

Les bases multidimensionnelles sont le plus souvent formées par agrégats de bases pouvant être relationnelles, en tout cas hétérogènes. Les données ainsi agrégées peuvent être analysées avec un nouveau type d'outil, OLAP (On-Line Analytical Processing) - là où les bases relationnelles utilisent OLTP (On-Line Transaction Processing). L'OLAP permet une analyse et une visualisation des données plus fines, pouvant utiliser plusieurs niveaux de granularité.

Le système OLAP crée ses requêtes tout d'abord en choisissant une dimension, puis en regroupant les faits. Il s'oppose au système OLTP par son utilisation au cas par cas dans un cadre décisionnel (groupement de tendances) sur de très grands lots de données, plutôt que l'utilisation quotidienne et répétitive d'OLTP.

La complexité d'OLAP le limite à une utilisation dans le cas de requêtes de grande envergure. Certaines de ses commandes SQL divergent largement de celles dont on a l'habitude : RANK(), DENSE_RANK(), NTILE(), PERCENT_RANK()...

 
Xavier Borderie, JDN Développeurs
 
 
Accueil | Haut de page