Co je to těžba prostorových dat?

Dolování prostorových dat je proces pokusu najít vzory v geografických datech. Nejběžněji se používá v maloobchodě a vyrostl z oblasti dolování dat, která se zpočátku zaměřovala na hledání vzorců v textových a numerických elektronických informacích. Dolování prostorových dat je považováno za složitější výzvu než tradiční těžba kvůli obtížím spojeným s analýzou objektů s konkrétními existencemi v prostoru a čase.

Stejně jako u standardní těžby dat se těžba prostorových dat používá především ve světě marketingu a maloobchodu. Je to technika pro rozhodování o tom, kde otevřít jaký druh obchodu. Může pomoci informovat o těchto rozhodnutích zpracováním již existujících údajů o tom, jaké faktory motivují spotřebitele, aby šli na jedno místo a ne na jiné místo.

Řekněme, že Ashley chce otevřít noční klub v určitém městském bloku. Kdyby měla přístup k příslušným údajům, mohla by pomocí průzkumu prostorových dat zjistit, jaké prostorové faktory způsobují úspěšnost nočních klubů. Mohla by položit otázky jako: Přijde do klubu více lidí, pokud je v blízkosti veřejná doprava? Jaká vzdálenost od jiných nočních podniků maximalizuje sponzorství? Je blízkost k čerpacím stanicím plus nebo mínus?

Ashley by možná také chtěla zajistit, aby lidé, kteří přicházejí do jejího nočního klubu, dorazili rovnoměrně v průběhu jednotlivé noci. Mohla také použít dolování prostorových dat - možná přesněji, dolování časoprostorových dat - aby zjistila, jak se lidé v určitých časech pohybují městem. Stejný postup lze použít i na sponzorství během různých nocí v týdnu.

Problémy s těžbou prostorových dat jsou výsledkem složitosti světa mimo internet. Zatímco v minulých snahách o těžbu dat byly obvykle připraveny databáze pro analýzu, vstupy dostupné pro těžbu prostorových dat nejsou sítě informací, ale mapy. Tyto mapy obsahují různé typy objektů, jako jsou silnice, populace, firmy atd.

Zjišťování, zda je něco „blízké“, něco jiného vede od diskrétní k spojité proměnné. To výrazně zvyšuje složitost potřebnou pro analýzu. Je neuvěřitelné, že je to jeden z nejjednodušších typů vztahů, které má někdo, kdo se pokouší o těžbu prostorových dat, k dispozici.

Dolování prostorových dat také čelí problému falešných pozitiv. V procesu hledání dat hledajících vztahy se objeví mnoho zjevných trendů v důsledku statistických falešných pozitiv. Tento problém existuje také pro úkol těžby jednodušší databáze, ale je umocněn velikostí dat dostupných pro horník prostorových dat. Nakonec by měl být trend identifikovaný těžbou prostorových dat potvrzen procesem vysvětlování a dalšího výzkumu.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?