Che cos'è il data mining spaziale?
Il data mining spaziale è il processo di ricerca di modelli nei dati geografici. Utilizzato più comunemente nella vendita al dettaglio, è cresciuto dal campo del data mining, che inizialmente si è concentrato sulla ricerca di modelli di informazioni elettroniche testuali e numeriche. Il data mining spaziale è considerato una sfida più complicata rispetto al mining tradizionale a causa delle difficoltà associate all'analisi di oggetti con esistenze concrete nello spazio e nel tempo.
Come per il data mining standard, il data mining spaziale viene utilizzato principalmente nel mondo del marketing e della vendita al dettaglio. È una tecnica per prendere decisioni su dove aprire che tipo di negozio. Può aiutare a informare queste decisioni elaborando dati preesistenti su quali fattori motivano i consumatori ad andare in un luogo e non in un altro.
Di 'che Ashley vuole aprire una discoteca in un certo isolato. Se avesse accesso ai dati appropriati, potrebbe utilizzare il data mining spaziale per scoprire quali fattori spaziali rendono i night club di successo. Potrebbe porre domande del tipo: più persone verranno al club se il trasporto pubblico è nelle vicinanze? Quale distanza da altri locali della vita notturna massimizza il patrocinio? La vicinanza alle stazioni di servizio è un vantaggio o un segno negativo?
Ashley potrebbe anche voler garantire che le persone che vengono nel suo nightclub arrivino in una distribuzione uniforme nel corso di una notte individuale. Poteva anche usare il data mining spaziale - forse più precisamente, il data mining temporaneo - per scoprire come le persone si muovono attraverso la città in determinati momenti. Lo stesso processo potrebbe essere applicato al patrocinio in diverse notti della settimana.
Le difficoltà del data mining spaziale sono il risultato della complessità del mondo oltre Internet. Mentre gli sforzi passati nel data mining di solito avevano database maturi per l'analisi, gli input disponibili per il data mining spaziale non sono griglie di informazioni ma mappe. Queste mappe hanno diversi tipi di oggetti come strade, popolazioni, attività commerciali e così via.
Determinare se qualcosa è "vicino a" qualcos'altro passa dall'essere una variabile discreta a una continua. Ciò aumenta enormemente la complessità richiesta per l'analisi. Incredibilmente, questo è uno dei tipi più semplici di relazioni disponibili per qualcuno che tenta di estrarre i dati spaziali.
Il data mining spaziale affronta anche il problema dei falsi positivi. Nel processo di ricerca dei dati alla ricerca di relazioni, emergeranno molte tendenze apparenti come conseguenza di falsi positivi statistici. Questo problema esiste anche per l'attività di mining di un database più semplice, ma è amplificato dall'entità dei dati disponibili per il minatore di dati spaziali. In definitiva, una tendenza identificata dal data mining spaziale dovrebbe essere confermata attraverso il processo di spiegazione e ricerca aggiuntiva.