¿Qué es la minería de datos estadísticos?

La minería de datos estadísticos, también conocido como conocimiento o descubrimiento de datos, es un método computarizado para recopilar y analizar información. La herramienta de minería de datos toma datos y clasifica la información para descubrir patrones o correlaciones que pueden usarse en aplicaciones importantes, como medicina, programación de computadoras, promoción comercial y diseño robótico. Las técnicas de minería de datos estadísticos utilizan matemáticas complejas y procesos estadísticos complicados para crear un análisis.

La minería de datos implica cinco pasos principales. La primera aplicación de minería de datos recopila datos estadísticos y coloca la información en un programa de tipo almacén. A continuación, los datos en el almacén se organizan y crean un sistema de gestión. El siguiente paso crea una forma de acceder a los datos administrados. Luego, el cuarto paso desarrolla software para analizar los datos, también conocidos como regresión de minería de datos, mientras que el paso final facilita el uso o interpretación de los datos estadísticos de manera práctica.

En general, la minería de datosLas técnicas integran sistemas de datos analíticos y de transacción. El software analítico se clasifica a través de ambos tipos de sistemas de datos utilizando preguntas de usuario abiertas. Las preguntas abiertas permiten innumerables respuestas para que los programadores no influyan en los resultados de la clasificación. Los programadores crean listas de preguntas para ayudar a clasificar la información utilizando un enfoque general.

La clasificación

se basa en el desarrollo de clases y grupos de datos, asociaciones encontradas en los datos e intenta definir patrones y tendencias basadas en las asociaciones. Por ejemplo, Google recopila información sobre los hábitos de compra de los usuarios para ayudar a colocar publicidad en línea. Preguntas abiertas utilizadas para ordenar los datos del comprador Se centran en las preferencias de compra o la visualización de los usuarios de Internet.

Los científicos y programadores informáticos se centran en el análisis de los datos estadísticos que se recopilan. Creación de árboles de decisión, artifiLas redes neuronales cial, el método vecino más cercano, la inducción de reglas, la visualización de datos y los algoritmos genéticos utilizan los datos minados estadísticamente. Estos sistemas de clasificación ayudan a interpretar las asociaciones descubiertas por los programas de datos analíticos. La minería de datos estadísticos implica proyectos pequeños que se pueden hacer a pequeña escala en una computadora doméstica, pero la mayoría de los conjuntos de asociación de minería de datos son tan grandes y la regresión de la minería de datos es tan complicada que requieren una supercomputadora o una red de computadoras de alta velocidad.

La minería de datos estadísticos recopila tres tipos generales de datos, incluidos datos operativos, datos no operacionales y meta datos. En una tienda de ropa, los datos operativos son datos básicos utilizados para ejecutar el negocio, como contabilidad, ventas y control de inventario. Los datos no operacionales, que están indirectamente relacionados con el negocio, incluyen estimaciones de ventas futuras e información general sobre el mercado nacional de ropa. Meta Data se refiere a los datos en sí. Un programa uSing Meta Data puede ordenar a los clientes en clasificaciones basadas en el género o la ubicación geográfica de los compradores de ropa o el color favorito de los clientes, si se recopilaban esos datos.

Una aplicación de minería de datos puede ser extremadamente sofisticada y la herramienta de minería de datos estadísticos puede tener aplicaciones prácticas generalizadas. El estudio de los brotes de enfermedades es un ejemplo. Un proyecto de minería de datos de 2000 analizó el brote de enfermedad de Cryptosporidium en Ontario, Canadá para determinar las causas del aumento en los casos de enfermedades. Los resultados de la minería de datos ayudaron a vincular el brote de bacterias con las condiciones locales del agua y la falta de tratamiento municipal adecuado. Un campo llamado "biosurveilance" utiliza minería de datos epidemiológicos para identificar brotes de una sola enfermedad.

.

Los programadores y diseñadores de computadoras también emplean el estudio de la probabilidad y el análisis de datos estadísticos para desarrollar máquinas y programas de computadora. El motor de búsqueda de Google Internet fue diseñado con STAMinería de datos tísticos. Google continúa recopilando y usando la minería de datos para crear actualizaciones y aplicaciones del programa.

OTROS IDIOMAS