Co je schéma?
Schéma párování je technika používaná ke sloučení dvou nebo více složitých databází nebo souborů informací do sebe. Vzhledem k tomu, že se používání databází a elektronického ukládání informací rozšiřuje přes internet, je třeba definovat metody slučování sad dat z jedné databáze do druhé a přiřazování schémat je jednou z těchto technik. Koncept je jednoduchý, ale realita slučování dat je poměrně složitá.
Termín „přizpůsobení schématu“ se používá synonymně jako „mapování schématu“, protože uživatelé ve skutečnosti mapují data a neodpovídají jim. Dvě nebo více databází jsou mapovány společně a podobné aspekty každé databáze jsou mapovány do sebe. Nejběžnějším způsobem sloučení dat je použití přesných odkazů. Příkladem tohoto stylu slučování je kombinace sloupce názvu jedné databáze se sloupcem názvu jiné databáze.
Sloučení není pro lidi nebo počítače obvykle tak jednoduché. Vzhledem k tomu, že je třeba filtrovat, kombinovat a používat tolik dat, je nezbytné mít jednu databázi spíše než více databází. Mapování schémat se zaměřuje na automatizaci a efektivitu tohoto zdlouhavého procesu. Příkladem toho, kde je nutné přizpůsobení schématu, může být situace, kdy má jedna databáze pole „studenta hlavní“ a jiná databáze má pole „studenta oboru“. Jsou to stejné informace, ale mírně odlišné tituly komplikují úsilí o jejich smíchání.
Přiřazení schématu rozdělí tento složitý proces slučování databází do čtyř kroků: před integrací, porovnáním, přizpůsobováním a slučováním. Před sloučením více databází je třeba analyzovat podobnosti a rozdíly. V oblasti shody se schématem se nazývá předintegrace. Počítač začíná určovat nejefektivnější metodu integrace.
Počítač dále vyhodnotí schémata porovnáním mezi sebou na podrobnější úrovni. V kroku porovnání počítač vyhledá každou položku databáze a určí, kde mohou být konflikty. Příkladem je situace, kdy pole „zájem studentů“ uvádí „doktor“ a jiná databáze jej uvádí jako „lékař“. Osoba by pravděpodobně rozpoznala tyto informace jako stejné, ale pro databázové nástroje jsou to dvě samostatné entity.
Jakmile počítač zjistí všechny potenciální konflikty, může se pokusit vyřešit tyto problémy. To může být stejně jednoduché jako změna všech případů „lékaře“ na „lékaře“. Ve skutečnosti je tento proces podstatně složitější.
Jakmile budou všechny konflikty vyřešeny, počítač může pokračovat v sloučení dat v procesu přizpůsobení schématu. V této fázi jsou dvě nebo více databází sloučeny do jedné velké databáze. Pokud vše půjde dobře, nedojde během integrace a budoucího přístupu k databázi ke konfliktům nebo chybám.