¿Qué es la minería de datos?

La minería de datos utiliza una cantidad relativamente grande de potencia informática que funciona en un gran conjunto de datos para determinar regularidades y conexiones entre los puntos de datos. Los algoritmos que emplean técnicas de estadísticas, aprendizaje automático y reconocimiento de patrones se utilizan para buscar grandes bases de datos automáticamente. La minería de datos también se conoce como descubrimiento de conocimiento en bases de datos (KDD).

Como el término inteligencia artificial , la minería de datos es un término general que puede aplicarse a una serie de actividades diferentes. En el mundo corporativo, la minería de datos se usa con mayor frecuencia para determinar la dirección de las tendencias y predecir el futuro. Se emplea para crear modelos y sistemas de apoyo a la decisión que brindan a las personas información que pueden usar. La minería de datos toma un papel de primera línea en la batalla contra el terrorismo. Supuestamente se usó para determinar al líder de los ataques del 11 de septiembre.Ring , Método de Holdout , K-Fold Validación cruzada , el método no-out , etc., y así sucesivamente. Las técnicas de regresión se utilizan para restar patrones irrelevantes, dejando solo información útil. El término bayesiano se ve con frecuencia en el campo, refiriéndose a una clase de técnicas de inferencia que predicen la probabilidad de eventos futuros al combinar probabilidades y probabilidades previas basadas en eventos condicionales. El filtrado de spam es posiblemente una forma de minería de datos, que automáticamente trae mensajes relevantes a la superficie desde un mar caótico de intentos de phishing y tonos de viagra.

Los árboles de decisión se utilizan para filtrar montañas de datos. En un árbol de decisión, todos los datos pasan a través de un nodo de entrada, donde enfrenta un filtro que separa los datos en flujos dependiendo de sus características. Por ejemplo, es probable que los datos sobre el comportamiento del consumidor se filtren en función de DFactores emográficos. La minería de datos no se trata principalmente de gráficos elegantes y técnicas de visualización, sino que los emplea para mostrar lo que ha encontrado. Se sabe que podemos absorber más información estadística visualmente que verbalmente y este formato para la presentación puede ser muy persuasivo y poderoso si se usa en el contexto correcto.

A medida que nuestra civilización se sature cada vez más en los datos y los sensores se distribuyen en masa en nuestros entornos locales, inadvertidamente descubriremos cosas que podrían perderse en el primer paso. La minería de datos nos permitirá corregir estos errores y descubrir nuevas ideas basadas en datos pasados, dándonos más explosiones para nuestro dólar de almacenamiento de datos.

OTROS IDIOMAS