Co to jest wydobycie danych?
Wydobycie magazynów danych to analiza informacji zawartych w jednej lub kilku bazach danych, aby informacje były przydatne. Te bazy danych lub hurtowni danych są centralnym depozytem dla danych. Firmy agregują informacje, które gromadzi swoich klientów w hurtowni danych. Po zebraniu informacji są „wydobywane”, a przydatne informacje są wyodrębnione z nich w celu uzyskania informacji, które mogą pomóc firmie w podejmowaniu decyzji biznesowych, które zwiększą zyski lub obniżyć koszty. Detaliści często wykorzystują wydobycie magazynów danych do analizy i przewidywania zachowania swoich klientów.
Na przykład, gdy kupujący idzie do supermarketu i podaje kasjerowi swoją częstą kartę kupującą, informacje o jej zakupach są gromadzone i przechowywane w hurtowni danych firmy. Łańcuch supermarketów będzie miał miliony danych na temat tego, co ludzie kupują, kiedy, w jakich ilościach i za jaką cenę. Sklep może wiedzieć, że ostatnie sprzedano 50 000 pakietów mrożonego groszkuRok, ale same te informacje nie są szczególnie pomocne. Jeśli jednak wydobycie magazynów danych ujawni, że 75% z zamrożonego groszku zostało sprzedanych w miesiącach, gdy świeże groszek nie były dostępne lub że 10% groszku zostało sprzedanych w ciągu dwóch tygodni poprzedzających Święto Dziękczynienia, firma może być w stanie wykorzystać te informacje w celu zwiększenia ich rocznej sprzedaży mrożonego groszka.
Firmy mogą stosować techniki wydobycia hurtowni danych, aby przewidzieć przyszłą sprzedaż. Wydobycie danych może również pomóc im w oszacowaniu wpływu decyzji dotyczących pończoch i cen. W supermarkecie wydobycie danych może powstrzymać sklepy przed wyczerpaniem mrożonego groszku w przypadku słabej plonu świeżego groszku w danym roku.
Regresja eksploracji danych to technika eksploracji danych, która służy do pokazania, co może się zdarzyć z wartością danych, jeśli coś w równaniu zostanie zmienione. Korzystając z przykładu supermarketu, regresja przewidywałabyPoziom sprzedaży mrożonego grochu, jeśli nowy groszek wzrósł w cenie. Regresja wykorzystuje dane historyczne i stosuje do nich formułę, która przewiduje przyszłe zachowanie.
Firmy często używają aplikacji do wydobywania hurtowni danych do gromadzenia i wydobywania swoich danych. Prawidłowe zastosowanie zależy od liczby danych, które mają i rodzaj analizy, którą chcą wykonać. Wybór prawidłowego narzędzia do wydobywania danych ma kluczowe znaczenie dla gromadzenia i interpretacji przydatnych danych.