¿Qué es la minería de flujo de datos?
La minería de flujo de datos es una estrategia que implica identificar y extraer información de un flujo de datos activo. Con este enfoque, la idea es extraer los datos sin crear ningún tipo de interrupción en la transmisión en sí, lo que hace posible que otros también hagan uso de los datos, incluso cuando la extracción se está llevando a cabo. Este tipo de esfuerzo de minería de flujo de datos puede involucrar todo tipo de datos, que van desde la transmisión de voz hasta la transmisión de video a través de Internet e incluso a las tareas diarias, como retirar dinero de una cuenta bancaria utilizando una máquina de cajero automatizada o mantener una conversación telefónica.
Una de las características de la minería del flujo de datos es la capacidad de proyectar o predecir con precisión cómo localizar la información deseada y qué tipo de herramientas de descubrimiento de conocimiento ayudará a localizar y extraer con éxito la información deseada. Por ejemplo, cuando un cliente inicia una transacción que usa una máquina de cajeros automatizada, la programación para la máquina inicia una búsquedaPara información relevante de la cuenta, ubica los datos y luego determina si el monto de la transacción reducirá el saldo de la cuenta por debajo de una cantidad permitida, en función de la forma en que se estructura la cuenta. A partir de ahí, la programación puede devolver datos relevantes al usuario, como documentar la finalización exitosa de la transacción solicitada y proporcionar el saldo de la cuenta restante después de que se registra el crédito o débito involucrado con la transacción.
Otro ejemplo común de minería de flujo de datos es la búsqueda web básica utilizando un navegador. Con esta aplicación, el usuario final ingresa los valores de búsqueda en un campo, y el software que impulsa el navegador busca interpretar esos valores y devolver datos que tienen cierta relevancia para los criterios de búsqueda. Dependiendo de cómo se configure el navegador, esto también puede incluir una característica que busca anticipar la intención de que se realice la búsqueda yOfrezca palabras o frases adicionales que puedan ayudar a refinar la búsqueda más del gusto del usuario. Una vez que el usuario se ha establecido en la frase de búsqueda, el navegador devuelve los resultados en orden de clasificación, utilizando algoritmos que son relevantes para la configuración del navegador en sí.
Uno de los principales beneficios de la minería del flujo de datos es la capacidad de acceder y buscar datos sin prohibir que otros utilicen esos mismos datos. Dado que los flujos de datos se actualizan constantemente, los resultados de la extracción pueden cambiar de vez en cuando. Por ejemplo, realizar una búsqueda web utilizando una frase de búsqueda específica puede producir un conjunto de resultados hoy, pero proporcionar un conjunto de resultados ligeramente diferente mañana, basado en qué nueva información ha ingresado a la secuencia de datos y cómo el motor de búsqueda clasifica esos datos.