Co to jest oprogramowanie hurtowni danych?
Oprogramowanie hurtowni danych wzrosło wykładniczo w ciągu ostatnich kilku lat i oczekuje się, że w przyszłości będzie miało wzrost powyżej średniej. Hurtownia danych to repozytorium wszystkich danych transakcyjnych organizacji lub firmy. Podstawowym celem hurtowni danych jest analiza transakcji i uruchamianie złożonych raportów.
Istnieją trzy podstawowe funkcje każdego produktu oprogramowania hurtowni danych: ekstrakcja danych, tworzenie struktury bazy danych i tworzenie niestandardowych zapytań. W branży informatycznej eksperci hurtowni danych są znani jako specjaliści analityki biznesowej. Zazwyczaj mają doświadczenie w matematyce, statystyce lub analizie systemu komputerowego. Często wymagane jest dodatkowe szkolenie w zakresie relacyjnych baz danych, architektury systemu i podstaw programowania w bazach danych.
Jedną z najważniejszych funkcji każdego oprogramowania hurtowni danych jest zdolność do prawidłowego wydobywania i strukturyzacji danych z różnych źródeł. Jest to często nazywane narzędziem wyodrębniania, przekształcania i ładowania (ETL). Hurtownie danych muszą być wypełnione danymi z systemu transakcyjnego w sposób, który zachowuje integralność i wzajemne relacje danych, jednocześnie umożliwiając pracownikom dostosowanie wydobywanych danych. Jest to istotna część architektury systemu.
Należy zauważyć, że większość programów do hurtowni danych służy do tworzenia, obsługi i konserwacji wielu zestawów danych. W wielu sytuacjach niektóre tabele są powielone we wszystkich kostkach, podczas gdy istnieją inne zestawy danych, które muszą pozostać osobne i odrębne. Na przykład kostka danych z danymi zakupu będzie miała wiele wspólnych punktów danych z kostką płatności od dostawcy. Jednak w każdej kostce będzie także zakres określonych informacji, które dotyczą tylko tej konkretnej kostki.
Architekt danych jest odpowiedzialny za identyfikację udostępnionych danych, potwierdzenie ich poprawności i umożliwienie dostępu do tych informacji w wielu kostkach, bez wpływu na integralność każdej kostki. Ponadto jest on odpowiedzialny za zarządzanie procesem przesyłania danych wymaganym do odświeżenia kostek danych. Może to być proces automatyczny lub ręczny, w zależności od złożoności kostek i sposobu dostarczania danych.
Wszystkie programy hurtowni danych są dostarczane z szeregiem standardowych raportów i zapytań. Raporty te są oparte na wspólnych potrzebach biznesowych i mają z reguły charakter dość ogólny. Na przykład raport dziesięciu najlepszych klientów według wielkości sprzedaży za bieżący rok jest częstym żądaniem raportu i byłby standardem w większości programów.
Jednak wiele firm uważa, że wymagają stworzenia niestandardowych raportów w celu spełnienia określonych potrzeb. Na przykład ten sam raport sprzedaży może wymagać podania nazw przedstawicieli handlowych i posortowania danych w obrębie określonych dzielnic lub terytoriów. Możliwość szybkiego utworzenia niestandardowego raportu i dostosowania go do istniejących potrzeb biznesowych ma zasadnicze znaczenie dla powodzenia tego typu oprogramowania.