Co je integrace dat?
Integrace dat je sloučení více zdrojů dat do jediného zdroje dat. Tato praxe je často velmi časově náročná a zapojena, protože různé zdroje dat jsou pravděpodobně mezi sebou nekompatibilní. Věci tak jednoduché jako různé názvy sloupců v tabulce jsou dostačující pro to, aby vyžadovaly přeformátování data. Tento proces je nejčastější v situacích, kdy dvě skupiny začaly bez spojení, ale jsou umístěny dohromady poté, co pracovaly nezávisle. Integrace dat se stala důležitějším tématem kvůli prevalenci bezplatných zdrojů dat a online databází.
Datová část integrace dat může být téměř cokoli, pokud je uložena v počítačovém systému. Skutečný obsah dat je zřídka stejně důležitý jako způsob, jakým jsou data uložena. Většinu času jsou data uchovávána v databázích, organizované systémy informací. Tyto systémy obsahují jedinečné položky a pole, které umožňují uživatelům rychle najít informace.
Největší překážka jakýchkoli datIntegrační proces jsou samotná data. V mnoha případech, kdy byla data poprvé stanovena, neexistoval žádný záměr sloučit datový soubor s jiným. To znamená, že i když dva datové sady se mohou vztahovat na stejnou věc, jsou zcela nekompatibilní.
Téměř cokoli bude nekompatibilní databáze. Něco tak jednoduchého, jako je rozdíl v prezentaci, jako je pořadí pole nebo šířka sloupce, může stačit k zabránění snadné sloučení. Pokud jsou data výrazně odlišná, například jedna databáze, která obsahuje více či méně informací, je sloučení mnohem obtížnější.
Dvě situace, které vyžadují integraci dat více než jakékoli jiné, jsou v oboru a výzkumné oblasti. V obchodním světě vyžaduje sloučení oddělení nebo společností kombinovat dříve oddělené informace do jediné struktury. Tato forma integrace je obecně velmi obtížná, pokud původníSkupiny používaly podobný software a měly podobné informační cíle.
Když je pro účely výzkumu prováděna integrace dat, obecně to jde mnohem plynulejší. Když jeden výzkumný pracovník umožňuje přístup k jeho informacím jinému, obě strany se obecně zabývají stejným procesem. To znamená, že budou používat podobné metody jako katalog a ukládat svá data.
V minulosti byla integrace dat relativně malá oblast dat studií, ale změnila se to od počátku 21. století. Vzhledem k tomu, že se bezplatné online databáze stávají populárnějšími a přesnějšími, společnosti se snaží získat své informace ve formátu sdílení. To jim umožňuje uvolnit své informace ve veřejné podobě a integrovat soukromá verze známých veřejných rozhraní do jejich systémů.