Co je sémantická integrace?
„Sémantická integrace“ je termín používaný v několika kontextech napříč různými oblastmi počítačového designu, programování, správy a správy. Obecně se jedná o agregaci informací z jednoho nebo více odlišných zdrojů za účelem vytvoření nějakého systému, ve kterém jsou informace uspořádány způsobem, který dává uživateli smysl. Sémantická integrace se často zabývá definováním a navázáním spojení metadat nebo vztahů mezi různými částmi různých zdrojů dat, aby mohla být logicky strukturována. To by mohlo zahrnovat vytvoření relačních spojení mezi dvěma samostatnými databázemi, sestavení grafu vzájemného vztahu částí různých webů nebo integraci faktických dat z neznámého, libovolného formátu do stručné struktury záznamu. Existuje mnoho praktických aplikací pro plně implementovaný sémantický integrační systém, včetně výzkumných knihoven nebo sítí, více algoritmů organického vyhledávače, které mohou extrapolovat kontext z vyhledávání a nakonec - pomocí použití metadatového publikování - bezproblémovou integraci různých počítačových systémů pro výměnu dat .
Konečným cílem sémantické integrace je ve většině případů schopnost dynamicky spojovat informace. Ve velmi jednoduchém příkladu by to mohlo znamenat možnost asociovat pole v jedné databázi s poli v jiné databázi, a to navzdory skutečnosti, že se nejedná o přesné shody, jako je propojení pole s názvem "size" s polem s názvem "height". Toto přiřazení by mohlo být provedeno pomocí uživatelsky definovaných pravidel, která specificky spojují tato dvě, nebo by to mohlo být provedeno pomocí algoritmů, které porovnávají numerická data polí a určují pravděpodobnou shodu. Slova „velikost“ a „výška“ se pak stávají termíny metadat, které mohou ostatní externí sémantické integrační systémy použít k nalezení informací pro uživatele, aniž by musely přesně vědět, jak kterýkoli jediný systém ukládá data.
Ve složitých sémantických integračních systémech, jako jsou systémy určené pro výzkum, je zveřejňování a sdílení metadat klíčovou součástí provozu. Metadata mohou být vyřazena z dokumentů a vytvářet velké relační datové struktury, které mohou pomoci při dotazech. To znamená, že výzkumné práce na jakémkoli tématu mohou být integrovány do systému, který měří a zaznamenává četnost slov, a tato slova mohou pomoci při vyhledávání informací uživatele, což umožňuje, aby související témata byla uvedena z jakéhokoli zdroje bez potřeby konkrétních konverzí.
Jednou z výzev, kterým čelí návrháři systémů sémantické integrace, je způsob agregace dat. Použití lidí k třídění a vytváření vztahů mezi daty z různých zdrojů může být časově náročné a v konečném důsledku velmi závislé na individuálních zkušenostech člověka. Pokud se algoritmy používají k automatickému vytváření asociací, mohou být některé vztahy přehlíženy kvůli malému rozdílu, který algoritmus nedokáže vyřešit. Metoda implementace sémantické integrace ve velkém měřítku využívá algoritmy založené na učení ve spojení se správou lidských pravidel a v některých případech skutečným lidským rozhodováním během procesu.