Jakie są różne typy projektowania hurtowni danych?
Hurtownie danych przechowują ogromne ilości danych do wykorzystania w wielu różnych dziedzinach. Istnieją dwa główne typy projektowania hurtowni danych: odgórne i oddolne. Te dwa projekty mają swoje zalety i wady. Wdrożenie oddolne jest łatwiejsze i tańsze, ale jest mniej kompletne, a korelacje danych są bardziej sporadyczne. W odgórnym projekcie połączenia między danymi są oczywiste i dobrze ugruntowane, ale dane mogą być nieaktualne, a wdrożenie systemu kosztowne.
Marty danych są centralną postacią w projekcie hurtowni danych. Mart data to zbiór danych oparty na jednej koncepcji. Każda baza danych jest unikalnym i kompletnym podzbiorem danych. Każda z tych kolekcji jest całkowicie wewnętrznie skorelowana i często ma połączenia z zewnętrznymi centrami danych.
Sposób obsługi rzutników danych jest główną różnicą między dwoma stylami projektowania hurtowni danych. W odgórnym projekcie marty danych występują naturalnie, gdy dane są wprowadzane do systemu. W oddolnym projekcie marty danych są tworzone bezpośrednio i łączone ze sobą, tworząc magazyn. Chociaż może się to wydawać niewielką różnicą, powoduje to zupełnie inny projekt.
Metodą odgórną był oryginalny projekt hurtowni danych. Dzięki tej metodzie wszystkie informacje przechowywane przez organizację są umieszczane w systemie. Każdy szeroki temat będzie miał swój własny ogólny obszar w bazach danych. Gdy dane są wykorzystywane, pojawią się połączenia między korelującymi punktami danych i pojawią się marty danych. Ponadto wszelkie dane w systemie pozostają tam na zawsze - nawet jeśli dane zostaną zastąpione lub zbanalizowane przez późniejsze informacje, pozostaną w systemie jako zapis przeszłych zdarzeń.
Metoda oddolna projektowania hurtowni danych działa w przeciwnym kierunku. Firma wprowadza informacje jako samodzielną martwicę danych. Z biegiem czasu inne zestawy danych są dodawane do systemu, albo jako ich własna baza danych, albo jako część tego, który już istnieje. Kiedy dwa marty danych są uważane za wystarczająco połączone, łączą się ze sobą w jedną jednostkę.
Oba projekty hurtowni danych mają swoje mocne i słabe strony. Metoda odgórna to ogromny projekt dla jeszcze mniejszych zestawów danych. Ponieważ duże projekty są również bardziej kosztowne, jest najdroższe pod względem pieniędzy i siły roboczej. Jeśli hurtownia danych jest ukończona i utrzymywana, jest to ogromna kolekcja, zawierająca wszystko, co firma wie.
Proces oddolny jest znacznie szybszy i tańszy, ale ponieważ dane są wprowadzane w razie potrzeby, baza danych nigdy nie będzie kompletna. Ponadto korelacje między obiektami danych są tak silne, jak ich użycie ich powoduje. Jeśli istnieje silna korelacja, ale nie widzą jej użytkownicy, pozostaje ona niezwiązana.