Co je dolování dat?
Těžba datového skladu je analýza informací obsažených v jedné nebo více databázích, aby byly tyto informace užitečné. Tyto databáze nebo datové sklady jsou centrálním depozitářem pro data. Společnosti shromažďují informace, které shromažďují o svých zákaznících, v datovém skladu. Jakmile jsou informace shromážděny, jsou „vytěženy“ a jsou z nich extrahovány užitečné informace, aby se získaly informace, které mohou společnosti pomoci podnikat obchodní rozhodnutí, která zvýší zisky nebo sníží náklady. Maloobchodníci často používají těžbu datového skladu k analýze a předpovídání chování svých zákazníků.
Například, když nakupující jde do supermarketu a dává pokladně její častou kartu kupujícího, informace o jejích nákupech se shromažďují a ukládají do datového skladu společnosti. Řetězec supermarketu bude obsahovat miliony údajů o tom, co lidé kupují, kdy, v jakém množství a za jakou cenu. Obchod může vědět, že v loňském roce bylo prodáno 50 000 balíčků zmrazeného hrachu, ale tato informace sama o sobě není nijak zvlášť užitečná. Pokud však těžba datového skladu odhalí, že 75% těchto zmrazených hrachů bylo prodáno během měsíců, kdy nebyl čerstvý hrášek k dispozici, nebo že 10% hrachů bylo prodáno během dvou týdnů před díkůvzdáním, může být společnost schopná použít tyto informace ke zvýšení jejich ročního prodeje zmrazeného hrachu.
Společnosti mohou využívat techniky těžby datového skladu k předpovídání budoucích prodejů. Dolování dat jim může také pomoci odhadnout dopad rozhodnutí o skladování a tvorbě cen. V supermarketu může dolování dat zabránit tomu, aby v obchodech nedocházelo mražený hrášek v případě špatné úrody čerstvého hrachu v daném roce.
Regrese dolování dat je technika dolování dat, která se používá k ukázání toho, co se pravděpodobně stane s datovou hodnotou, pokud se něco v rovnici změní. Na příkladu supermarketu by regrese předpověděla úroveň prodeje zmrazeného hrachu, pokud by čerstvý hrášek vzrostl v ceně. Regrese používá historické údaje a aplikuje na ni vzorec, který předpovídá budoucí chování.
Společnosti často používají ke shromažďování a těžbě svých dat softwarovou aplikaci pro těžbu datového skladu. Správná aplikace je určena množstvím dat, která mají, a typem analýzy, kterou chtějí provést. Výběr správného nástroje pro dolování dat je zásadní pro shromažďování a interpretaci užitečných dat.