¿Qué es la minería de data warehouse?
La minería de almacenamiento de datos es el análisis de la información contenida en una o más bases de datos para que la información sea útil. Estas bases de datos, o almacenes de datos, son un depósito central de datos. Las empresas agregan la información que recopilan sobre sus clientes en un almacén de datos. Una vez que se ha recopilado la información, se "extrae" y se extrae información útil para producir información que pueda ayudar a la empresa a tomar decisiones comerciales que aumentarán las ganancias o reducirán los costos. Los minoristas utilizan con frecuencia la minería de almacenamiento de datos para analizar y predecir el comportamiento de sus clientes.
Por ejemplo, cuando un comprador va al supermercado y le entrega al cajero su tarjeta de comprador frecuente, la información sobre sus compras se recopila y almacena en el almacén de datos de la compañía. Una cadena de supermercados tendrá millones de datos sobre lo que la gente compra, cuándo, en qué cantidades y a qué precio. Una tienda puede saber que se vendieron 50,000 paquetes de guisantes congelados el año pasado, pero esa información por sí sola no es particularmente útil. Sin embargo, si la minería del almacén de datos revela que el 75% de esos guisantes congelados se vendieron durante los meses en que los guisantes frescos no estaban disponibles, o que el 10% de los guisantes se vendieron en las dos semanas previas al Día de Acción de Gracias, la compañía podría usar esa información para aumentar sus ventas anuales de guisantes congelados.
Las empresas pueden emplear técnicas de minería de almacenamiento de datos para predecir ventas futuras. La minería de datos también puede ayudarlos a estimar el impacto de las decisiones de almacenamiento y fijación de precios. En el supermercado, la minería de datos podría evitar que las tiendas se queden sin guisantes congelados en el caso de una mala cosecha de guisantes frescos en un año determinado.
La regresión de minería de datos es una técnica de minería de datos que se usa para mostrar lo que es probable que suceda con un valor de datos si se cambia algo en la ecuación. Usando el ejemplo del supermercado, la regresión predeciría el nivel de ventas de guisantes congelados si los guisantes frescos aumentaran de precio. La regresión utiliza datos históricos y le aplica una fórmula que predice el comportamiento futuro.
Las empresas suelen utilizar una aplicación de software de minería de almacenamiento de datos para recopilar y extraer sus datos. La aplicación correcta está determinada por la cantidad de datos que tienen y el tipo de análisis que desean hacer. Elegir la herramienta de minería de datos correcta es fundamental para recopilar e interpretar datos útiles.