Czym jest integracja semantyczna?
„Integracja semantyczna” jest terminem używanym w kilku kontekstach w różnych obszarach projektowania, programowania, zarządzania i administracji komputerowej. Zasadniczo odnosi się do agregowania informacji z jednego lub kilku różnych źródeł w celu stworzenia systemu, w którym informacje są zorganizowane w sposób, który ma sens dla użytkownika. Integracja semantyczna często zajmuje się definiowaniem i ustanawianiem połączeń lub relacji metadanych między różnymi częściami różnych źródeł danych, aby można je było logicznie uporządkować. Może to obejmować tworzenie relacyjnych połączeń między dwiema oddzielnymi bazami danych, tworzenie wykresu relacji między częściami różnych stron internetowych lub integrowanie danych faktycznych z nieznanego, arbitralnego formatu w zwięzłej strukturze rekordów. Istnieje wiele praktycznych zastosowań w pełni zaimplementowanego semantycznego systemu integracji, w tym bibliotek lub sieci badawczych, bardziej organicznych algorytmów wyszukiwarek, które mogą ekstrapolować kontekst z wyszukiwania, a ostatecznie - dzięki wykorzystaniu publikacji metadanych - płynnej integracji różnych systemów komputerowych do wymiany danych .
Ostatecznym celem integracji semantycznej w większości przypadków jest możliwość powiązania informacji w sposób dynamiczny. W bardzo prostym przykładzie może to oznaczać możliwość powiązania pól w jednej bazie danych z polami w innej bazie danych, pomimo faktu, że nie są one dokładnie zgodne, na przykład poprzez powiązanie pola o nazwie „rozmiar” z polem o nazwie „wysokość”. Powiązanie to można wykonać za pomocą reguł zdefiniowanych przez użytkownika, które konkretnie łączą te dwa, lub można to zrobić za pomocą algorytmów, które porównują dane liczbowe pól i określają prawdopodobne dopasowanie. Słowa „rozmiar” i „wysokość” stają się wówczas terminami metadanych, które inne zewnętrzne semantyczne systemy integracji mogą być w stanie znaleźć w celu znalezienia informacji dla użytkownika bez konieczności szczegółowego wiedzieć, w jaki sposób jakikolwiek pojedynczy system przechowuje dane.
W złożonych systemach integracji semantycznej, takich jak te przeznaczone do badań, publikacja i udostępnianie metadanych jest kluczowym elementem działania. Metadane mogą być usuwane z dokumentów w celu utworzenia dużych relacyjnych struktur danych, które mogą pomóc w zapytaniach. Oznacza to, że prace badawcze na dowolny temat mogą zostać zintegrowane z systemem, który mierzy i rejestruje częstotliwość słów, a te słowa mogą pomóc w wyszukiwaniu informacji przez użytkownika, umożliwiając wyświetlanie pokrewnych tematów z dowolnego źródła bez potrzeby określonych konwersji.
Jednym z wyzwań, przed którymi stają projektanci semantycznych systemów integracji, jest sposób agregacji danych. Używanie ludzi do klasyfikowania i dokonywania relacji między danymi z różnych źródeł może być czasochłonne i ostatecznie bardzo zależne od indywidualnych doświadczeń danej osoby. Gdy algorytmy są używane do automatycznego tworzenia powiązań, niektóre relacje mogą zostać przeoczone z powodu niewielkiej różnicy, której algorytm nie jest w stanie rozwiązać. Metoda implementacji integracji semantycznej na dużą skalę wykorzystuje algorytmy oparte na uczeniu się w połączeniu z zarządzaniem regułami opartymi na ludziach, a w niektórych przypadkach na podejmowaniu rzeczywistych decyzji przez człowieka w trakcie procesu.