¿Cuáles son los conceptos más importantes de minería de datos?
Los conceptos de minería de datos más importantes se utilizan para el análisis de la información recopilada, especialmente en el esfuerzo por observar un comportamiento. Las interacciones desconocidas entre los datos se investigan de varias maneras para determinar las relaciones críticas entre los sujetos y la información agregada. Un desafío en la minería de datos es que la información real recopilada puede no ser una reminiscencia de todo el dominio. En un esfuerzo por abordar este hecho, las correlaciones entre los datos pueden ser controladas metódicamente por los diversos conceptos de minería de datos.
Los estándares para los conceptos de minería de datos son aplicados por el Grupo de Interés Especial de la Asociación de Maquinaria de Computación sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD). Esta organización publica la "Revista internacional de tecnología de la información y toma de decisiones", así como la revista SIGKDD Explorations. Hacer cumplir la ética y los principios básicos de la minería de datos mantiene a la industria trabajando de manera eficiente y con problemas legales limitados.
El preprocesamiento de la información es uno de los aspectos más importantes de la minería de datos. Los datos sin procesar se deben extraer e interpretar. Para realizar esta acción, se debe determinar un proceso, se deben ensamblar los datos de destino y encontrar patrones. El proceso se conoce como Knowledge Discovery en bases de datos y fue desarrollado por Gregory Piatetsky-Shapiro en 1989.
Cuatro clases diferentes de conceptos de minería de datos permiten que el proceso tenga lugar. La agrupación en clúster utiliza el algoritmo creado a partir del proceso de minería de datos para ensamblar elementos en grupos similares. A diferencia de la agrupación, la clasificación de la información es cuando los datos se ensamblan en grupos predefinidos y se analizan. La asociación intenta encontrar relaciones entre variables, determinando qué grupos de datos están comúnmente asociados. El último tipo de minería de datos es la regresión , basada en el método de identificación de una función dentro de la recopilación de datos.
Validar la información es el paso final para descubrir qué representa la aplicación de minería de datos. Cuando no todos los algoritmos presentan un conjunto de datos válido, los patrones que ocurren pueden dar lugar a una situación llamada sobreajuste. Para superar este problema, los datos se comparan con un conjunto de prueba. Este es un concepto en el que las mediciones están alineadas con una serie de algoritmos que proporcionarían un conjunto plausible de conjuntos de datos. Si la información adquirida no se alinea con el conjunto de prueba, entonces los patrones asumidos en los datos deben ser inexactos.
Algunos de los conceptos más importantes de minería de datos se producen en una variedad de industrias. Los juegos, los negocios, el marketing, la ciencia, la ingeniería y la vigilancia utilizan técnicas de minería de datos. Al realizar estas técnicas, cada campo puede determinar las mejores prácticas o mejores formas de encontrar resultados.