Skip to main content

Что такое семантическая интеграция?

«Семантическая интеграция» - это термин, используемый в нескольких контекстах в различных областях компьютерного дизайна, программирования, управления и администрирования. В общем, это относится к агрегированию информации из одного или нескольких разнородных источников с целью создания некоторой системы, в которой информация организована таким образом, который имеет смысл для пользователя. Семантическая интеграция часто связана с определением и установлением связей метаданных или отношений между различными частями различных источников данных, чтобы их можно было логически структурировать. Это может включать создание реляционных связей между двумя отдельными базами данных, построение графика того, как части различных веб-сайтов связаны друг с другом, или интеграцию фактических данных из неизвестного произвольного формата в краткую структуру записей. Существует множество практических приложений для полностью реализованной системы семантической интеграции, в том числе исследовательские библиотеки или сети, более органичные алгоритмы поисковых систем, которые могут экстраполировать контекст из поиска и, в конечном итоге, благодаря использованию публикации метаданных, - бесшовная интеграция различных компьютерных систем для обмена данными. ,

Конечная цель семантической интеграции в большинстве случаев заключается в том, чтобы иметь возможность динамически связывать информацию. В очень простом примере это может означать возможность связывать поля в одной базе данных с полями в другой базе данных, несмотря на тот факт, что они не являются точными совпадениями, например связывать поле с именем «size» с полем с именем «height». Эта связь может быть выполнена с помощью пользовательских правил, которые конкретно связывают их, или это может быть сделано с помощью алгоритмов, которые сравнивают числовые данные полей и определяют вероятное совпадение. Слова «размер» и «высота» затем становятся терминами метаданных, которые другие внешние системы семантической интеграции могли бы использовать для поиска информации для пользователя, не зная конкретно, как любая отдельная система хранит данные.

В сложных системах семантической интеграции, таких как системы, предназначенные для исследований, публикация и обмен метаданными является ключевым компонентом для работы. Метаданные можно отбирать из документов для формирования больших структур реляционных данных, которые могут помочь в запросах. Это означает, что исследовательские работы по любой теме могут быть интегрированы в систему, которая измеряет и регистрирует частоту слов, и эти слова могут помочь в поиске информации пользователями, позволяя перечислять связанные темы из любого источника без необходимости конкретных преобразований.

Одна из проблем, с которой сталкиваются разработчики систем семантической интеграции, заключается в том, как агрегировать данные. Использование людей для классификации и установления связей между данными из различных источников может занимать много времени и, в конечном счете, очень зависеть от индивидуального опыта человека. Когда алгоритмы используются для автоматического создания ассоциаций, некоторые отношения могут быть пропущены из-за небольшого различия, которое алгоритм не может разрешить. В методе реализации семантической интеграции в больших масштабах используются алгоритмы, основанные на обучении, в сочетании с управлением правилами, основанным на человеке, и, в некоторых случаях, фактическим принятием решения человеком в процессе.