Quels sont les différents types de systèmes d'entrepôt de données?
Il existe deux systèmes principaux d'entrepôt de données; normalisé et dimensionnel. Dans une structure normalisée, les données sont limitées à une simple présentation d'informations factuelles. Les données ne contiennent pas de contexte ni d’arrière-plan au-delà de ce que l’utilisateur est disposé à corréler. Dans un système dimensionnel, les informations viennent dans un contexte d'autres faits qui montrent ce que les données sont dans leur ensemble. Dans ce cas, il existe une multitude d'informations disponibles, que vous le vouliez ou non.
Les deux principaux systèmes d'entrepôt de données sont les deux extrêmes. Dans la plupart des entrepôts de données, un terrain d'entente est atteint entre ces deux. Les descriptions actuelles correspondent à la forme la plus pure du style, même si cela se produit rarement.
Les données normalisées sont les deux systèmes d’entrepôt de données les plus faciles à mettre en œuvre et à manipuler. Dans ce style, les informations sont réduites à des faits individuels sans aucun lien avec d'autres données. Par exemple, le numéro de série et le nom du produit sont mis en place sans aucune information supplémentaire. Les informations sont disponibles pour tous les utilisateurs qui le souhaitent, mais ils doivent faire le travail pour que cela veuille dire n'importe quoi.
Afin de donner un sens aux informations dans les systèmes d'entrepôt de données normalisés, l'utilisateur collecte les informations connectées pour rassembler une image complète. Afin de trouver le numéro de téléphone d'un client, les informations ci-dessus peuvent être associées à un numéro de série et à un numéro de compte de la personne qui a acheté l'article. Ensuite, le numéro de compte et le nom pourraient être localisés. Enfin, le nom et le numéro de téléphone sont trouvés. Chacune de ces étapes est une requête de base de données distincte présentée par l'utilisateur pour collecter des informations.
Les données dimensionnelles sont l'exact opposé. En général, ces systèmes d'entrepôt de données sont les plus faciles à utiliser pour les humains, mais les plus difficiles à modifier ou à manipuler. Lorsque les informations sont collectées, tout est combiné en une grosse boule de données. Au lieu d'un numéro de série et d'un numéro de produit, une facture d'achat complète serait saisie en même temps.
Si un utilisateur devait rechercher un numéro de téléphone dans une base de données dimensionnelle, le processus serait différent. Le numéro de série donnerait un historique complet pour ce client, les noms et les dates de tout ce qui avait été acheté, ainsi que tous les appels ou retours de service. De plus, chaque adresse et numéro de téléphone utilisé par le client serait également disponible directement. Le tableau est très complet, mais peut-être si complet que les informations requises sont difficiles à trouver.