Co je těžba datového skladu?
Těžba skladů dat je analýza informací obsažených v jedné nebo více databázích, aby byly informace užitečné. Tyto databáze nebo datové sklady jsou ústředním depozitářem pro data. Společnosti agregují informace, které shromažďují na svých zákaznících v datovém skladu. Jakmile jsou informace shromážděny, jsou „těženy“ a užitečné informace z nich jsou získány k poskytnutí informací, které mohou společnosti pomoci přijímat obchodní rozhodnutí, která zvýší zisky nebo sníží náklady. Maloobchodníci často používají těžbu datových skladů k analýze a předpovídání chování svých zákazníků.
Například, když nakupující jde do supermarketu a dává pokladně její častý nakupovací kartu, informace o jejích nákupech se shromažďují a ukládají v datovém skladu společnosti. Řetězec supermarketů bude mít miliony údajů o tom, co si lidé kupují, kdy, v jakém množství a za jakou cenu. Obchod může vědět, že 50 000 balíčků zmrazeného hrášku bylo prodáno naposledyRok, ale tato informace sama o sobě není nijak zvlášť užitečná. Pokud však těžba datového skladu odhalí, že 75% z těch zmrazených hrášků bylo prodáno v měsících, kdy nebyl k dispozici čerstvý hrášek, nebo že 10% hrášku bylo prodáno za dva týdny vedoucích k díkůvzdání, může společnost moci tyto informace použít ke zvýšení jejich ročního prodeje zmrazeného hrázů.
Společnosti mohou používat techniky těžby datových skladů k předpovídání budoucího prodeje. Dolování dat jim také může pomoci odhadnout dopad rozhodnutí o skladování a cenách. V supermarketu může těžba dat zabránit tomu, aby obchody v daném roce došly zmrazený hrášek v případě špatné plodiny čerstvého hrášku.
Regrese dolování dat je technika těžby dat, která se používá k zobrazení toho, co se pravděpodobně stane s hodnotou dat, pokud se něco v rovnici změní. Pomocí příkladu supermarketu by regrese předpovídalaÚroveň prodeje zmrazeného hrachu, pokud se čerstvý hrášek zvýšil v ceně. Regrese používá historická data a aplikuje na to vzorec, který předpovídá budoucí chování.
Společnosti často používají softwarovou aplikaci pro těžbu datového skladu ke shromažďování a těžiště jejich dat. Správná aplikace je určena množstvím dat, která mají, a typem analýzy, kterou chtějí udělat. Výběr správného nástroje pro těžbu dat je rozhodující pro shromažďování a interpretaci užitečných dat.