Jaka jest różnica między eksploracją danych a hurtownią danych?
Warunki eksploracji danych i hurtowni danych są często mylone zarówno przez personel biznesowy, jak i techniczny. Cały obszar zarządzania danymi przeżywał fenomenalny rozwój dzięki wdrożeniu programów do gromadzenia danych i obniżeniu kosztów pamięci komputera. Podstawowym celem obu tych funkcji jest zapewnienie narzędzi i metodologii do badania wzorców i znaczenia w dużej ilości danych.
Podstawowe różnice między eksploracją danych a hurtownią danych to projekty systemów, zastosowana metodologia i cel. Eksploracja danych polega na wykorzystaniu logiki rozpoznawania wzorców do trendów tożsamości w przykładowym zbiorze danych i ekstrapolacji tych informacji na większą pulę danych. Magazynowanie danych to proces wyodrębniania i przechowywania danych w celu ułatwienia raportowania.
Eksploracja danych to ogólny termin używany do opisywania szeregu procesów biznesowych, które czerpią wzorce z danych. Zazwyczaj do identyfikacji określonych wzorców wykorzystywany jest pakiet oprogramowania do analizy statystycznej na podstawie zestawu danych i zapytań generowanych przez użytkownika końcowego. Typowym zastosowaniem eksploracji danych jest tworzenie ukierunkowanych programów marketingowych, identyfikacja oszustw finansowych i oznaczanie nietypowych wzorców zachowań w ramach przeglądu bezpieczeństwa.
Doskonałym przykładem eksploracji danych jest proces wykorzystywany przez firmy telefoniczne do wprowadzania produktów na rynek dla obecnych klientów. Firma telefoniczna korzysta z oprogramowania do eksploracji danych, aby uzyskać dostęp do swojej bazy danych zawierającej informacje o klientach. Zostało napisane zapytanie w celu zidentyfikowania klientów, którzy subskrybowali podstawowy pakiet telefoniczny i usługę internetową w określonym czasie. Po wybraniu tego zestawu danych powstaje kolejne zapytanie w celu ustalenia, ilu z tych klientów skorzystało z bezpłatnych dodatkowych funkcji telefonu podczas promocji próbnej. Wyniki tej eksploracji danych ujawniają wzorce zachowań, które mogą prowadzić lub pomóc w udoskonaleniu planu marketingowego w celu zwiększenia korzystania z dodatkowych usług telefonicznych.
Należy zauważyć, że głównym celem eksploracji danych jest wykrywanie wzorców w danych. Specyfikacje użyte do zdefiniowania zestawu próbek mają ogromny wpływ na trafność wyników i dokładność analizy. Wracając do powyższego przykładu, jeśli zbiór danych jest ograniczony do klientów w określonym obszarze geograficznym, wyniki i wzorce będą się różnić od szerszego zestawu danych. Chociaż zarówno eksploracja danych, jak i hurtownia danych działają z dużymi ilościami informacji, stosowane procesy są zupełnie inne.
Hurtownia danych to oprogramowanie, które służy do przechowywania dużych ilości danych oraz uruchamiania specjalnie zaprojektowanych zapytań i raportów. Business Intelligence to rosnąca dziedzina badań, która koncentruje się na hurtowni danych i powiązanych funkcjach. Narzędzia te mają na celu wyodrębnianie danych i przechowywanie ich w metodzie zaprojektowanej w celu zapewnienia zwiększonej wydajności systemu. Wiele terminologii w eksploracji danych i hurtowni danych jest takich samych, co prowadzi do większego zamieszania.