Co je porovnávání schématu?
Shodnocení schématu je technika používaná k sloučení dvou nebo složitějších databází nebo sad informací do sebe. Vzhledem k tomu, že používání databází a elektronického ukládání informací zvětšuje a složitější přes internet, musí být definované metody sloučení sad dat z jedné databáze do druhé a porovnávání schématu je jednou z takových technik. Koncept je jednoduchý, ale realita sloučení dat je poměrně složitá. Dvě nebo více databází jsou mapovány společně a podobné aspekty každé databáze jsou navzájem mapovány. Nejběžnějším způsobem sloučení dat je použití přesných odkazů. Příkladem tohoto stylu sloučení je kombinace jmen sloupce jedné databáze s sloupcem názvu jiné databáze.
Sloučení není obvykle tak jednoduché, pro lidi nebo počítače. S tolika údaji, které musí být filtrovány, kombinované a použity, s OJe nezbytná spíše databáze NE než více databází. Mapování schématu se zaměřuje na to, aby byl tento únavný proces automatizován a efektivnější. Příkladem toho, kde je nutné porovnávat schéma, může být, když jedna databáze má poli „hlavní studentské“ a jiná databáze má pole „studentovy pole studie“. Jsou to stejné informace, ale trochu odlišné tituly komplikují úsilí o jeho smíchání.
Schéma porovnává tento složitý proces sloučení databází do čtyř kroků: předintegrace, srovnání, přizpůsobení a sloučení. Než bude možné sloučit více databází, je třeba je analyzovat z hlediska podobností a rozdílů. V oblasti shody schématu se to nazývá předintegrace. Počítač začíná určovat nejúčinnější metodu integrace.
Dále počítač vyhodnocuje schémata jejich porovnáním navzájem na podrobnější úrovni. Ve srovnáníP, počítač se zabývá každou položkou databáze a určuje, kde mohou dojít ke konfliktům. Příkladem toho je, když pole „zájem studenta“ uvádí „lékař“ a další databáze ji uvádí jako „lékař“. Osoba by pravděpodobně rozpoznala informace jako stejné, ale pro databázové nástroje jsou to dvě samostatné entity.
Jakmile počítač určí všechny potenciální konflikty, může se posunout vpřed a pokusit se tyto problémy vyřešit. To může být stejně jednoduché jako změna všech případů „lékaře“ na „doktora“. Ve skutečnosti je tento proces podstatně složitější.
Jakmile jsou všechny konflikty opraveny, může počítač pokračovat se sloučením dat do procesu porovnávání schématu. V této fázi jsou dvě nebo více databází sloučeny do jedné velké databáze. Pokud vše půjde dobře, během integrace a budoucí přístup k databázi nedojde k žádné konflikty ani chybám.