Vad är rumsdata gruvdrift?
Spatial data mining är processen för att försöka hitta mönster i geografiska data. Det som oftast används inom detaljhandeln har vuxit ur området för datalagring, som ursprungligen fokuserade på att hitta mönster i text- och numerisk elektronisk information. Utveckling av rumsdata anses vara en mer komplicerad utmaning än traditionell gruvdrift på grund av svårigheterna med att analysera föremål med konkreta existenser i rum och tid.
Liksom med vanlig dataanvinning används rumslig datautvinning främst i världen för marknadsföring och detaljhandel. Det är en teknik för att fatta beslut om var man ska öppna vilken typ av butik. Det kan hjälpa till att informera dessa beslut genom att bearbeta befintlig information om vilka faktorer som motiverar konsumenterna att gå till en plats och inte till en annan.
Säg att Ashley vill öppna en nattklubb på ett visst stadsblock. Om hon hade tillgång till lämplig data, kunde hon använda rumslig datautvinning för att ta reda på vilka rumsliga faktorer som gör nattklubbarna framgångsrika. Hon kanske ställer frågor som: Kommer fler människor till klubben om kollektivtrafiken är i närheten? Vilket avstånd från andra nattlivsplatser maximerar beskydd? Är närheten till bensinstationer ett plus eller ett minus?
Ashley kanske också vill se till att de människor som kommer till hennes nattklubb kommer till en jämn fördelning under en individuell natt. Hon kunde också använda rumslig datautvinning - kanske mer exakt, rumslig tidsbearbetning - för att ta reda på hur människor rör sig genom staden vid vissa tider. Samma process kan tillämpas på beskydd på olika nätter i veckan.
Svårigheterna med rumslig datautvinning är ett resultat av komplexiteten i världen bortom internet. Medan tidigare ansträngningar vid datakommunikation vanligtvis hade databaser mogna för analys, är de ingångar som finns tillgängliga för rumslig databehandling inte informationsnät utan kartor. Dessa kartor har olika typer av objekt som vägar, befolkningar, företag och så vidare.
Att bestämma om något är "nära", går från att vara en diskret till en kontinuerlig variabel. Detta ökar massivet komplexiteten som krävs för analys. Otroligt, detta är en av de mer enkla typerna av förhållanden som finns tillgängliga för någon som försöker bryta rumslig data.
Utvinning av rumsliga data står också inför felaktiga positiva effekter. I processen med att söka data som letar efter relationer kommer många uppenbara trender att dyka upp som en konsekvens av statistiska falska positiver. Detta problem existerar också för uppgiften att bryta en enklare databas, men den förstärks av storleken på data som finns tillgängliga för den rumsliga datalagaren. I slutändan bör en trend som identifieras genom rumslig datautveckling bekräftas genom förklaringsprocessen och ytterligare forskning.