Co je to těžba prostorových dat?
Dolování prostorových dat je proces pokusu o nalezení vzorů v geografických datech. Nejčastěji se používají v maloobchodě, vyrostla z oblasti těžby dat, která se původně zaměřila na hledání vzorců v textových a numerických elektronických informacích. Dolování prostorových dat je považováno za složitější výzvu než tradiční těžba kvůli obtížím spojeným s analýzou objektů s konkrétními existencemi v prostoru a čase.
Stejně jako u standardní těžby dat se prostorová těžba používá především ve světě marketingu a maloobchodu. Je to technika pro rozhodování o tom, kde otevřít, jaký druh obchodu. Může pomoci informovat tato rozhodnutí zpracováním již existujících údajů o tom, jaké faktory motivují spotřebitele k tomu, aby šli na jedno místo a ne jiné.
říkat, že Ashley chce otevřít noční klub v určitém městském bloku. Pokud by měla přístup k příslušným údajům, mohla by použít těžbu prostorových dat, aby zjistila, jaké prostorové faktory činí noční kluby úspěšnými. MohlaZeptejte se jako: přijde do klubu více lidí, pokud je poblíž veřejná doprava? Jakou vzdálenost od jiných míst nočního života maximalizuje patronáž? Je blízkost čerpacích stanic plus nebo mínus?
Ashley by také mohl chtít zajistit, aby lidé, kteří přicházejí do jejího nočního klubu, dorazili do rovnoměrného rozdělení v průběhu individuální noci. Mohla také použít těžbu prostorových dat - možná přesněji, prostorová těžba dat -, aby zjistila, jak se lidé v určitých časech pohybují městem. Stejný proces lze použít na sponzorství v různých nocích týdne.
Obtížnost těžby prostorových dat jsou výsledkem složitosti světa mimo internet. Zatímco minulé úsilí o těžbu dat obvykle mělo databáze zralé pro analýzu, vstupy dostupné pro dolování prostorových dat nejsou mřížky informací, ale mapy. Tyto mapy mají různé typy objektů lIke silnice, populace, podniky atd.
Stanovení, zda je něco „blízké“ něčemu jinému, jde z diskrétního k nepřetržité proměnné. To masivně zvyšuje složitost potřebnou pro analýzu. Je neuvěřitelné, že je to jeden z jednodušších typů vztahů, které mají dostupné, aby se pokoušel o těžbu prostorových dat.
Dolování prostorových dat také čelí problému falešných pozitiv. V procesu vyhledávání dat hledající vztahy se v důsledku statistických falešných pozitiv objeví mnoho zjevných trendů. Tento problém také existuje pro úlohu těžby jednodušší databáze, ale je zesílena velikostí dat dostupných pro horního horníka. Nakonec by měl být trend identifikovaný dolováním prostorových dat potvrzen procesem vysvětlení a dalšího výzkumu.