Wat is ruimtelijke datamining?
Ruimtelijke datamining is het proces van het zoeken naar patronen in geografische gegevens. Het meest gebruikt in de detailhandel, is het gegroeid uit het veld van datamining, dat zich aanvankelijk richtte op het vinden van patronen in tekstuele en numerieke elektronische informatie. Ruimtelijke datamining wordt als een meer gecompliceerde uitdaging beschouwd dan traditionele mijnbouw vanwege de problemen die gepaard gaan met het analyseren van objecten met een concreet bestaan in ruimte en tijd.
Net als bij standaard datamining, wordt ruimtelijke datamining voornamelijk gebruikt in de wereld van marketing en retail. Het is een techniek om beslissingen te nemen over waar te openen wat voor soort winkel. Het kan helpen deze beslissingen te nemen door reeds bestaande gegevens te verwerken over welke factoren consumenten motiveren om naar de ene plaats en niet naar de andere te gaan.
Stel dat Ashley een nachtclub op een bepaald stadsblok wil openen. Als ze toegang had tot de juiste gegevens, kon ze ruimtelijke datamining gebruiken om erachter te komen welke ruimtelijke factoren nachtclubs succesvol maken. Ze zou vragen kunnen stellen zoals: Zullen er meer mensen naar de club komen als openbaar vervoer in de buurt is? Welke afstand tot andere uitgaansgelegenheden maximaliseert het beschermheerschap? Is de nabijheid van benzinestations een plus of min?
Ashley wil er misschien ook voor zorgen dat de mensen die naar haar nachtclub komen in een gelijkmatige verdeling aankomen in de loop van een individuele nacht. Ze zou ook ruimtelijke datamining kunnen gebruiken - misschien nauwkeuriger, spatiotemporele datamining - om erachter te komen hoe mensen zich op bepaalde tijden door de stad verplaatsen. Hetzelfde proces kan worden toegepast op patronage op verschillende avonden van de week.
De moeilijkheden van ruimtelijke datamining zijn een gevolg van de complexiteit van de wereld buiten het internet. Terwijl in het verleden inspanningen op het gebied van datamining gewoonlijk databases rijp voor analyse hadden, zijn de beschikbare inputs voor ruimtelijke datamining geen rasters van informatie, maar kaarten. Deze kaarten hebben verschillende soorten objecten, zoals wegen, bevolkingsgroepen, bedrijven, enzovoort.
Bepalen of iets "dichtbij" is, gaat van een discrete naar een continue variabele. Dit verhoogt enorm de complexiteit die nodig is voor analyse. Ongelofelijk, dit is een van de eenvoudigere soorten relaties die beschikbaar zijn voor iemand die ruimtelijke datamining probeert.
Ruimtelijke datamining wordt ook geconfronteerd met het probleem van valse positieven. Tijdens het zoeken naar gegevens op zoek naar relaties, zullen veel duidelijke trends naar voren komen als gevolg van statistische valse positieven. Dit probleem bestaat ook voor de taak om een eenvoudigere database te minen, maar het wordt versterkt door de hoeveelheid gegevens die beschikbaar is voor de ruimtelijke dataminer. Uiteindelijk moet een trend die wordt geïdentificeerd door ruimtelijke datamining worden bevestigd door het proces van uitleg en aanvullend onderzoek.