Quels sont les différents types de conception d'entrepôts de données?
Les entrepôts de données stockent de grandes quantités de données pouvant être utilisées dans de nombreux domaines. Il existe deux principaux types de conception d'entrepôt de données: top-down et bottom-up. Les deux modèles ont leurs propres avantages et inconvénients. La méthode ascendante est plus simple et moins coûteuse à mettre en œuvre, mais elle est moins complète et les corrélations de données sont plus sporadiques. Dans une conception descendante, les connexions entre les données sont évidentes et bien établies, mais les données peuvent être obsolètes et le système est coûteux à mettre en œuvre.
Les magasins de données sont la figure centrale de la conception d'entrepôts de données. Un data mart est une collection de données basée sur un concept unique. Chaque magasin de données est un sous-ensemble unique et complet de données. Chacune de ces collections est complètement corrélée en interne et a souvent des connexions à des data marts externes.
La manière dont les dépôts de données sont gérés constitue la principale différence entre les deux styles de conception d'entrepôt de données. Dans la conception descendante, les dépôts de données se produisent naturellement lorsque les données sont placées dans le système. Dans la conception ascendante, les dépôts de données sont réalisés directement et reliés entre eux pour former l’entrepôt. Bien que cela puisse sembler être une différence mineure, cela donne une conception très différente.
La méthode descendante était la conception d'origine de l'entrepôt de données. À l'aide de cette méthode, toutes les informations de l'organisation sont stockées dans le système. Chaque vaste sujet aura son propre domaine général dans les bases de données. À mesure que les données sont utilisées, des connexions apparaissent entre les points de données corrélatifs et les magasins de données apparaissent. En outre, toutes les données du système y restent indéfiniment - même si les données sont remplacées ou banalisées par des informations ultérieures, elles resteront dans le système en tant que trace des événements passés.
La méthode ascendante de conception d'entrepôt de données fonctionne dans le sens opposé. Une entreprise met des informations en tant que data mart autonome. Au fil du temps, d'autres ensembles de données sont ajoutés au système, soit comme leur propre magasin de données, soit comme faisant partie d'un ensemble déjà existant. Lorsque deux magasins de données sont considérés suffisamment connectés, ils fusionnent en une seule unité.
Les deux conceptions d'entrepôts de données ont chacune leurs points forts et leurs points faibles. La méthode descendante est un projet énorme pour des ensembles de données encore plus petits. Etant donné que les grands projets sont également plus coûteux, c'est le plus coûteux en termes d'argent et de main-d'œuvre. Si l’entrepôt de données est terminé et maintenu, il s’agit d’une vaste collection contenant tout ce que l’entreprise sait.
Le processus ascendant est beaucoup plus rapide et moins coûteux, mais comme les données sont entrées au besoin, la base de données ne sera jamais complète. De plus, les corrélations entre les dépôts de données ne sont aussi fortes que leur utilisation les rend. Si une forte corrélation existe, mais qu'aucun utilisateur ne la voit, elle ne sera pas connectée.