Hvad er rumdataindustri?
Spatial data mining er processen med at forsøge at finde mønstre i geografiske data. Mest almindeligt anvendt i detailhandelen er det vokset ud af datadrift, som oprindeligt fokuserede på at finde mønstre i tekstuel og numerisk elektronisk information. Spatial data mining betragtes som en mere kompliceret udfordring end traditionel minedrift på grund af vanskelighederne ved analyse af genstande med konkrete eksistenser i rum og tid.
Som med standard data mining, bruges rumligt data mining primært i verden af marketing og detailhandel. Det er en teknik til at tage beslutninger om, hvor man skal åbne, hvilken slags butik. Det kan hjælpe med at informere disse beslutninger ved at behandle allerede eksisterende data om, hvilke faktorer der motiverer forbrugerne til at gå til et sted og ikke et andet.
Sig, at Ashley vil åbne en natklub på en bestemt byblok. Hvis hun havde adgang til de relevante data, kunne hun bruge minedrift af geografisk data til at finde ud af, hvilke geografiske faktorer der gør nattklubber til succes. Hun stiller måske spørgsmål som: Kommer flere til klubben, hvis der er offentlig transport i nærheden? Hvilken afstand fra andre nattelivspladser maksimerer protektion? Er nærhed til tankstationer et plus eller et minus?
Ashley ønsker måske også at sikre, at de mennesker, der kommer til hendes natklub, ankommer i en jævn fordeling i løbet af en individuel nat. Hun kunne også bruge rumlig datamining - måske mere præcist, rumlig tidsmæssig dataindvinding - for at finde ud af, hvordan folk bevæger sig gennem byen på bestemte tidspunkter. Den samme proces kunne anvendes til protektion over forskellige ugen i ugen.
Vanskelighederne ved rumlig dataudvinding er et resultat af verdens kompleksitet ud over internettet. Mens de tidligere bestræbelser på datamining normalt havde databaser modne til analyse, er de tilgængelige input til rumlig datamining ikke informationsnet, men kort. Disse kort har forskellige typer objekter som veje, befolkninger, virksomheder osv.
At bestemme, om noget er "tæt på", går noget andet fra at være en diskret til en kontinuerlig variabel. Dette øger den kompleksitet, der kræves til analyse, massivt. Utroligt er dette en af de mere enkle typer af relationer, der er tilgængelige for nogen, der forsøger rumlig dataudvikling.
Spatial data mining er også udsat for problemet med falske positiver. I processen med at søge data på udkig efter relationer vil mange tilsyneladende tendenser dukke op som en konsekvens af statistiske falske positiver. Dette problem eksisterer også til opgaven med at udvinde en mere enkel database, men det forstærkes af størrelsen af data, der er tilgængelige for den rumlige datagruver. I sidste ende skal en tendens, der identificeres ved rumlig datadrift, bekræftes gennem forklaringsprocessen og yderligere forskning.