Skip to main content

Что такое извлечение знаний?

Извлечение знаний - это процесс использования различных источников информации для создания единого банка знаний. Как часть этого подхода, добыча часто будет опираться на ряд структурированных и неструктурированных источников. В случае успеха извлечение знаний приводит к получению надежных данных, которые могут быть легко прочитаны и интерпретированы данной программой, что позволяет конечному пользователю использовать эти формальные знания для любых целей, которые он или она желает.

Несколько различных источников могут быть использованы в процессе извлечения знаний. В рамках структурированных источников данные могут быть извлечены из различных типов реляционных баз данных или некоторого типа расширяемого языка разметки или источника XML. Неструктурированные источники, такие как изображения, различные формы документов для обработки текстов, электронные таблицы и даже текст, захваченный в программах стиля блокнота, могут использоваться как часть процесса извлечения. Пока источники доступны для чтения программе, используемой для управления процессом извлечения знаний, они могут использоваться в качестве источников, которые расширяют потенциал для проекта, который продвигается посредством извлечения, и позволяют использовать полученные окончательные знания для использования. ,

Есть несколько общих приложений, которые происходят с извлечением знаний. Одним из частых примеров является возможность сбора данных из неструктурированного источника и включения в некоторый тип структурированного источника знаний. Извлечение данных, найденных в реляционных базах данных, и их использование для создания новых документов или использования электронных документов для импорта данных в реляционные базы данных - еще один пример того, как этот тип извлечения может ускорить обмен формальными знаниями без необходимости ввода данных вручную это уже доступно из какого-то другого источника. Такое повторное использование существующих знаний в каком-то новом формате часто очень полезно в ряде сценариев, позволяя использовать эти знания способами, которые, возможно, были бы невозможны с существующим источником. Таким образом, пользователь может создавать источники, которые идеально подходят для ряда различных приложений, а не только те, которые имеют отношение к первоначальному месту формального знания.

Используя извлечение данных, можно использовать обширное хранилище данных, легко импортируя и экспортируя данные, как способ создания нового источника, который можно использовать для конкретной цели. Эти вновь созданные источники, в свою очередь, также находят место в хранилище данных и могут в конечном итоге использоваться для создания новых извлечений, которые используются для удовлетворения новых потребностей использования. Имея это в виду, извлечение знаний можно рассматривать как очень полезный инструмент, который помогает максимально эффективно использовать имеющиеся в настоящее время ресурсы, упрощая многие задачи, связанные с обменом этими формальными знаниями.