¿Qué es la minería de datos espaciales?
La minería de datos espaciales es el proceso de tratar de encontrar patrones en datos geográficos. Más comúnmente utilizado en el comercio minorista, ha surgido del campo de la minería de datos, que inicialmente se centró en encontrar patrones en información electrónica textual y numérica. La minería de datos espaciales se considera un desafío más complicado que la minería tradicional debido a las dificultades asociadas con el análisis de objetos con existencias concretas en el espacio y el tiempo.
Al igual que con la minería de datos estándar, la minería de datos espaciales se usa principalmente en el mundo del marketing y el comercio minorista. Es una técnica para tomar decisiones sobre dónde abrir qué tipo de tienda. Puede ayudar a informar estas decisiones procesando datos preexistentes sobre qué factores motivan a los consumidores a ir a un lugar y no a otro.
Diga que Ashley quiere abrir un club nocturno en un determinado bloque de la ciudad. Si tuviera acceso a los datos apropiados, podría usar la minería de datos espaciales para averiguar qué factores espaciales hacen que los clubes nocturnos sean exitosos. Ella podríaHaga preguntas como: ¿Vendrán más personas al club si el transporte público está cerca? ¿Qué distancia de otros lugares de vida nocturna maximiza el patrocinio? ¿Es la proximidad a las estaciones de servicio un plus o un menos?
Ashley también podría querer asegurarse de que las personas que vengan a su club nocturno lleguen a una distribución uniforme en el transcurso de una noche individual. También podría usar la minería de datos espaciales, tal vez con mayor precisión, minería de datos espacio -temporales, para descubrir cómo las personas se mueven por la ciudad en ciertos momentos. El mismo proceso podría aplicarse al patrocinio en diferentes noches de la semana.
Las dificultades de la minería de datos espaciales son el resultado de la complejidad del mundo más allá de Internet. Mientras que los esfuerzos pasados en la minería de datos generalmente tenían bases de datos maduras para el análisis, las entradas disponibles para la minería de datos espaciales no son cuadrículas de información sino mapas. Estos mapas tienen diferentes tipos de objetos lIke Roads, poblaciones, negocios, etc.
Determinar si algo está "cerca" de algo más pasa de ser una variable discreta a una continua. Esto aumenta masivamente la complejidad requerida para el análisis. Increíblemente, este es uno de los tipos más simples de relaciones disponibles para alguien que intenta minería de datos espaciales.
La minería de datos espaciales también enfrenta el problema de los falsos positivos. En el proceso de búsqueda de datos en busca de relaciones, muchas tendencias aparentes surgirán como consecuencia de falsos positivos estadísticos. Este problema también existe para la tarea de extraer una base de datos más simple, pero se amplifica por la magnitud de los datos disponibles para el minero de datos espaciales. En última instancia, una tendencia identificada por la minería de datos espaciales debe confirmarse a través del proceso de explicación e investigación adicional.