¿Qué es la minería de datos espaciales?
La minería de datos espaciales es el proceso de tratar de encontrar patrones en los datos geográficos. Más comúnmente utilizado en el comercio minorista, ha crecido fuera del campo de la minería de datos, que inicialmente se centró en encontrar patrones en la información electrónica textual y numérica. La minería de datos espaciales se considera un desafío más complicado que la minería tradicional debido a las dificultades asociadas con el análisis de objetos con existencias concretas en el espacio y el tiempo.
Al igual que con la minería de datos estándar, la minería de datos espaciales se utiliza principalmente en el mundo del marketing y el comercio minorista. Es una técnica para tomar decisiones sobre dónde abrir qué tipo de tienda. Puede ayudar a informar estas decisiones procesando datos preexistentes sobre qué factores motivan a los consumidores a ir a un lugar y no a otro.
Digamos que Ashley quiere abrir un club nocturno en cierta cuadra de la ciudad. Si tuviera acceso a los datos apropiados, podría usar la minería de datos espaciales para averiguar qué factores espaciales hacen que los clubes nocturnos tengan éxito. Ella podría hacer preguntas como: ¿Vendrán más personas al club si hay transporte público cerca? ¿Qué distancia de otros lugares de vida nocturna maximiza el mecenazgo? ¿La proximidad a las estaciones de servicio es un plus o un menos?
Ashley también podría querer asegurarse de que las personas que vienen a su club nocturno lleguen en una distribución uniforme en el transcurso de una noche individual. También podría usar la minería de datos espaciales, tal vez con mayor precisión, la minería de datos espacio-temporal, para descubrir cómo las personas se mueven por la ciudad en ciertos momentos. El mismo proceso podría aplicarse al mecenazgo en diferentes noches de la semana.
Las dificultades de la minería de datos espaciales son el resultado de la complejidad del mundo más allá de Internet. Mientras que los esfuerzos anteriores en la minería de datos generalmente tenían bases de datos maduras para el análisis, las entradas disponibles para la minería de datos espaciales no son cuadrículas de información sino mapas. Estos mapas tienen diferentes tipos de objetos como carreteras, poblaciones, negocios, etc.
Determinar si algo está "cerca de" algo más pasa de ser una variable discreta a una variable continua. Esto aumenta enormemente la complejidad requerida para el análisis. Increíblemente, este es uno de los tipos de relaciones más simples disponibles para alguien que intenta la minería de datos espaciales.
La minería de datos espaciales también enfrenta el problema de los falsos positivos. En el proceso de búsqueda de datos en busca de relaciones, surgirán muchas tendencias aparentes como consecuencia de falsos positivos estadísticos. Este problema también existe para la tarea de extraer una base de datos más simple, pero se amplifica por la magnitud de los datos disponibles para el minero de datos espaciales. En última instancia, una tendencia identificada por la minería de datos espaciales debe confirmarse mediante el proceso de explicación e investigación adicional.