Jaký je rozdíl mezi dolováním dat a skladováním dat?
Termíny dolování dat a skladování dat jsou často zaměňovány jak obchodním, tak technickým personálem. Celá oblast správy dat zaznamenala fenomenální růst s implementací softwarových programů pro sběr dat a sníženými náklady na paměť počítače. Primárním účelem obou funkcí je poskytnout nástroje a metodologie pro prozkoumání vzorců a významu ve velkém množství dat.
Primární rozdíly mezi těžbou a skladováním dat jsou návrhy systémů, použitá metodika a účel. Dolování dat je použití logiky rozpoznávání vzorů k trendům identity ve vzorové sadě dat a extrapoluje tyto informace proti většímu datovému fondu. Skladování dat je proces získávání a ukládání dat, který umožňuje snadnější vykazování.
Dolování dat je obecný termín používaný k popisu řady obchodních procesů, které odvozují vzorce z dat. Softwarový balíček statistické analýzy se obvykle používá k identifikaci specifických vzorů na základě sady dat a dotazů generovaných koncovým uživatelem. Typickým využitím dolování dat je vytváření cílených marketingových programů, identifikace finančních podvodů a označování neobvyklých vzorců chování v rámci kontroly zabezpečení.
Vynikajícím příkladem dolování dat je proces používaný telefonními společnostmi k uvádění produktů na trh stávajícím zákazníkům. Telefonní společnost používá software pro získávání dat k přístupu do své databáze zákaznických informací. Je napsán dotaz, který identifikuje zákazníky, kteří se přihlásili k odběru základního telefonního balíčku a internetové služby v konkrétním časovém rámci. Jakmile je tato sada dat vybrána, je zapsán další dotaz, který určí, kolik z těchto zákazníků využilo bezplatných dalších funkcí telefonu během zkušební propagace. Výsledky tohoto dolování dat odhalují vzorce chování, které mohou řídit nebo napomoci vylepšit marketingový plán s cílem zvýšit využívání dalších telefonních služeb.
Je důležité si uvědomit, že primárním účelem dolování dat je najít v datech vzory. Specifikace použité k definování souboru vzorků mají obrovský dopad na relevanci výstupu a přesnost analýzy. Vrátíme-li se k výše uvedenému příkladu, pokud je sada údajů omezena na zákazníky v konkrétní zeměpisné oblasti, výsledky a vzorce se budou lišit od širší sady dat. Přestože těžba dat i skladování dat pracují s velkým objemem informací, použité procesy jsou zcela odlišné.
Datový sklad je softwarový produkt, který se používá k ukládání velkých objemů dat a spouštění speciálně navržených dotazů a sestav. Business intelligence je rostoucí obor studia, který se zaměřuje na skladování dat a související funkce. Tyto nástroje jsou navrženy tak, aby extrahovaly data a ukládaly je způsobem navrženým tak, aby poskytovaly zvýšený výkon systému. Většina terminologie v dolování a ukládání dat je stejná, což vede k většímu zmatku.