O que é integração semântica?
"Integração semântica" é um termo usado em vários contextos em diferentes áreas de design, programação, gerenciamento e administração de computadores. Em geral, refere -se a agregar informações de uma ou mais fontes díspares com o objetivo de criar algum sistema no qual as informações sejam organizadas de uma maneira que faça sentido para um usuário. A integração semântica freqüentemente lida com a definição e o estabelecimento de conexões de metadados, ou relacionamentos, entre diferentes partes das diferentes fontes de dados para que possam ser estruturadas logicamente. Isso pode envolver a criação de conexões relacionais entre dois bancos de dados separados, construindo um gráfico de como partes de sites diferentes se relacionam ou integrando dados factuais de um formato arbitrário desconhecido em uma estrutura de registro concisa. Existem muitas aplicações práticas para um sistema de integração semântica totalmente implementado, incluindo bibliotecas ou redes de pesquisa, algoritmos mais orgânicos de mecanismo de pesquisa que podem extrapolar o contexto FRom a uma pesquisa e, finalmente - através do uso da publicação de metadados - integração perfeita de diferentes sistemas de computador para troca de dados.
O objetivo final da integração semântica na maioria dos casos é poder associar informações de maneira dinâmica. Em um exemplo muito simples, isso pode significar poder associar campos em um banco de dados a campos em outro banco de dados, apesar de não serem correspondentes exatos, como relacionar um campo chamado "tamanho" a um campo chamado "altura". Essa associação pode ser realizada através de regras definidas pelo usuário que vinculam especificamente os dois, ou podem ser feitos com algoritmos que comparam os dados numéricos dos campos e determinar uma correspondência provável. As palavras "tamanho" e "altura" tornam -se termos de metadados que outros sistemas de integração semântica externos podem usar para encontrar as informações para um usuário sem ter que saber especifiCally como qualquer sistema único armazena os dados.
Em sistemas complexos de integração semântica, como os projetados para pesquisa, a publicação e o compartilhamento de metadados é um componente essencial para operação. Os metadados podem ser selecionados a partir de documentos para formar grandes estruturas de dados relacionais que podem ajudar em consultas. Isso significa que os trabalhos de pesquisa sobre qualquer tópico podem ser integrados a um sistema que mede e registra a frequência das palavras, e essas palavras podem ajudar nas pesquisas de usuários de informações, permitindo que tópicos relacionados sejam listados de qualquer fonte sem a necessidade de conversões específicas.
Um dos desafios que enfrentam designers de sistemas de integração semântica é como agregar os dados. O uso de humanos para classificar e fazer relações entre dados de várias fontes pode ser demorado e, finalmente, muito dependente das experiências individuais da pessoa. Quando os algoritmos são usados para fazer associações automaticamente, certos relacionamentos podem ser negligenciados por causa de alguns pequenos diferentesque o algoritmo não consegue resolver. Um método de implementação de integração semântica em larga escala usa algoritmos baseados em aprendizado em conjunto com o gerenciamento de regras baseado em humanos e, em alguns casos, tomada de decisão humana real durante o processo.