Skip to main content

O que é integração semântica?

"Integração semântica" é um termo usado em vários contextos em diferentes áreas do design, programação, gerenciamento e administração de computadores. Em geral, refere-se à agregação de informações de uma ou mais fontes díspares com o objetivo de criar algum sistema no qual as informações sejam organizadas de uma maneira que faça sentido para o usuário. A integração semântica frequentemente lida com a definição e o estabelecimento de conexões ou relacionamentos de metadados entre diferentes partes das diferentes fontes de dados, para que possam ser estruturados logicamente. Isso pode envolver a criação de conexões relacionais entre dois bancos de dados separados, a criação de um gráfico de como partes de sites diferentes se relacionam entre si ou a integração de dados factuais de um formato arbitrário desconhecido em uma estrutura de registro concisa. Existem muitas aplicações práticas para um sistema de integração semântica totalmente implementado, incluindo bibliotecas ou redes de pesquisa, algoritmos de mecanismo de pesquisa mais orgânicos que podem extrapolar o contexto de uma pesquisa e, finalmente - através do uso de publicação de metadados - integração perfeita de diferentes sistemas de computadores para troca de dados .

O objetivo final da integração semântica na maioria dos casos é poder associar informações de maneira dinâmica. Em um exemplo muito simples, isso pode significar poder associar campos em um banco de dados a campos em outro banco de dados, apesar de não serem correspondências exatas, como relacionar um campo chamado "tamanho" a um campo chamado "altura". Essa associação pode ser realizada por meio de regras definidas pelo usuário que vinculam especificamente os dois, ou por algoritmos que comparam os dados numéricos dos campos e determinam uma provável correspondência. As palavras "tamanho" e "altura" tornam-se termos de metadados que outros sistemas externos de integração semântica podem usar para encontrar as informações de um usuário sem precisar saber especificamente como um sistema único armazena os dados.

Em sistemas complexos de integração semântica, como os projetados para pesquisa, a publicação e o compartilhamento de metadados é um componente essencial para a operação. Os metadados podem ser selecionados a partir de documentos para formar grandes estruturas de dados relacionais que podem ajudar nas consultas. Isso significa que os trabalhos de pesquisa sobre qualquer tópico podem ser integrados a um sistema que mede e registra a frequência das palavras, e essas palavras podem ajudar na busca de informações pelos usuários, permitindo que os tópicos relacionados sejam listados de qualquer fonte, sem a necessidade de conversões específicas.

Um dos desafios que os designers de sistemas de integração semântica enfrentam é como agregar os dados. Usar humanos para classificar e estabelecer relações entre dados de várias fontes pode consumir muito tempo e, em última instância, muito dependente das experiências individuais da pessoa. Quando algoritmos são usados ​​para fazer associações automaticamente, certos relacionamentos podem ser ignorados devido a alguma pequena diferença que o algoritmo não consegue resolver. Um método de implementação da integração semântica em larga escala usa algoritmos baseados em aprendizado em conjunto com o gerenciamento de regras com base em humanos e, em alguns casos, a tomada de decisões em humanos durante o processo.