Hva er gruvedrift av romlige data?
Spatial data mining er prosessen med å prøve å finne mønstre i geografiske data. Hyppigst brukt i detaljhandel, har den vokst ut av datadrift, som først fokuserte på å finne mønstre i tekstuell og numerisk elektronisk informasjon. Utvikling av romdata anses som en mer komplisert utfordring enn tradisjonell gruvedrift på grunn av vanskeligheter forbundet med å analysere objekter med konkrete eksistenser i rom og tid.
Som med standard data mining, brukes romlig data mining hovedsakelig i verden av markedsføring og detaljhandel. Det er en teknikk for å ta beslutninger om hvor du skal åpne hvilken type butikk. Det kan bidra til å informere disse beslutningene ved å behandle eksisterende data om hvilke faktorer som motiverer forbrukerne til å reise til et sted og ikke et annet.
Si at Ashley ønsker å åpne en nattklubb på en bestemt byblokk. Hvis hun hadde tilgang til passende data, kunne hun bruke gruvedrift av romlig data for å finne ut hvilke romlige faktorer som gjør nattklubber vellykkede. Hun kan stille spørsmål som: Kommer flere til klubben hvis kollektivtransport er i nærheten? Hvilken avstand fra andre utesteder maksimerer patronage? Er nærheten til bensinstasjoner et pluss eller et minus?
Ashley vil kanskje også sikre at personene som kommer til nattklubben hennes kommer til en jevn fordeling i løpet av en individuell natt. Hun kunne også bruke romlig datautvinning - kanskje mer nøyaktig, romlig tidsminnedrift - for å finne ut hvordan folk beveger seg gjennom byen på bestemte tider. Den samme prosessen kan brukes på patronage på forskjellige netter i uken.
Vanskene med gruvedrift av romlig data er et resultat av kompleksiteten i verden utover internett. Mens tidligere anstrengelser for data mining vanligvis hadde databaser modne for analyse, er inngangene som er tilgjengelige for romlig data mining, ikke informasjonsnett, men kart. Disse kartene har forskjellige typer objekter som veier, befolkninger, bedrifter og så videre.
Å bestemme om noe er "nær" noe annet går fra å være en diskret til en kontinuerlig variabel. Dette øker kompleksiteten som kreves for analyse massivt. Utrolig, dette er en av de mer enkle typer relasjoner som er tilgjengelige for noen som prøver å utvinne romlig data.
Utvikling av romlig data står også overfor problemet med falske positiver. I prosessen med å søke etter data på jakt etter sammenhenger, vil mange tilsynelatende trender dukke opp som en konsekvens av statistiske falske positiver. Dette problemet eksisterer også for oppgaven med å utvinne en enklere database, men den blir forsterket av omfanget av data som er tilgjengelig for den romlige datagruveren. Til syvende og sist bør en trend identifisert ved romlig datautvinning bekreftes gjennom forklaringsprosessen og ytterligere forskning.