¿Qué es la extracción de conocimiento?
La extracción de conocimiento es el proceso de hacer uso de varias fuentes de información para crear un banco de conocimiento cohesivo. Como parte de este enfoque, la extracción a menudo se basará en una gama de fuentes estructuradas y no estructuradas. Cuando tiene éxito, la extracción de conocimiento da como resultado datos sólidos que pueden leer e interpretar fácilmente un programa determinado, lo que permite que el usuario final utilice ese conocimiento formal para cualquier propósito que desee.
Se pueden utilizar varias fuentes diferentes en el proceso de extracción de conocimiento. Dentro del alcance de las fuentes estructuradas, los datos pueden extraerse de varios tipos de bases de datos relacionales o algún tipo de lenguaje de marcado extensible o fuente XML. Las fuentes no estructuradas, como imágenes, diferentes formas de documentos de procesamiento de textos, hojas de cálculo e incluso texto capturados en programas de estilo del bloc de notas pueden utilizarse como parte del proceso de extracción. Mientras las fuentes sean legibles para el programa que se utiliza para administrar el conocimiento extProceso de racción, se pueden utilizar como fuentes que amplían el potencial para el proyecto que se está avanzando mediante la extracción y permiten que el conocimiento final producido sea utilizable.
Hay varias aplicaciones comunes que ocurren con extracción de conocimiento. Un ejemplo frecuente es la capacidad de capturar datos de una fuente no estructurada e incorporar a algún tipo de fuente de conocimiento estructurada. Extraer datos encontrados en bases de datos relacionales y usarlos para crear nuevos documentos, o utilizar documentos electrónicos para importar datos en bases de datos relacionales, es otro ejemplo de cómo este tipo de extracción puede acelerar el intercambio de conocimientos formales sin la necesidad de ingresar manualmente los datos que ya están disponibles desde otra fuente. Esta reutilización del conocimiento existente en algún formato nuevo a menudo es muy útil en varios escenarios, lo que permite utilizar ese conocimientode manera que no haya sido posible con la fuente existente. De esta manera, el usuario puede crear fuentes que son ideales para varias aplicaciones diferentes en lugar de solo aquellas relevantes para el hogar original del conocimiento formal.
Con el uso de la extracción de datos, es posible utilizar un vasto almacén de datos, importando y exportando fácilmente los datos como una forma de crear una fuente nueva que se puede usar para un propósito específico. Estas fuentes recién creadas a su vez también encuentran un lugar en el almacén de datos y eventualmente se pueden utilizar en la creación de nuevas extracciones que se utilizan para satisfacer nuevas necesidades de uso. Con esto en mente, la extracción de conocimiento puede verse como una herramienta muy útil que ayuda a aprovechar al máximo todos los recursos actualmente disponibles, simplificando muchas de las tareas involucradas con el intercambio de ese conocimiento formal.