Co je integrace dat?
Integrace dat je sloučení více zdrojů dat do jednoho zdroje dat. Tato praxe je často velmi časově náročná a zapojená, protože různé zdroje dat jsou pravděpodobně vzájemně nekompatibilní. Věci tak jednoduché, jako jsou různé názvy sloupců v tabulce, stačí k přeformátování data. Tento proces je nejběžnější v situacích, kdy dvě skupiny začínají bez spojení, ale jsou seskupeny po samostatné práci. Integrace dat se stala důležitějším tématem v důsledku výskytu bezplatných zdrojů dat a online databází.
Datová část datové integrace může být téměř cokoli, pokud je uložena v počítačovém systému. Skutečný obsah dat je zřídka stejně důležitý jako způsob, jakým jsou data uložena. Data jsou většinou uchovávána v databázích, organizovaných informačních systémech. Tyto systémy obsahují jedinečné položky a pole, které umožňují uživatelům rychle najít informace.
Největší překážkou jakéhokoli procesu integrace dat jsou data samotná. V mnoha případech, když byla data poprvé nastavena, nebylo v úmyslu nikdy sloučit datový soubor s jiným. To znamená, že i když dva soubory dat mohou odkazovat na stejnou věc, jsou zcela nekompatibilní.
Téměř všechno způsobí nekompatibilitu databází. Něco tak jednoduchého jako rozdíl v prezentaci, například pořadí polí nebo šířka sloupců, může stačit, aby se zabránilo snadnému sloučení. Pokud jsou data výrazně odlišná, například jedna databáze, která obsahuje více či méně informací, sloučení je mnohem obtížnější.
Dvě situace, které vyžadují integraci dat více než kterákoli jiná, jsou v oblasti podnikání a výzkumu. V obchodním světě vyžaduje slučování oddělení nebo společností sloučení dříve samostatných informací do jediné struktury. Tato forma integrace je obecně velmi obtížná, pokud původní skupiny nepoužívaly podobný software a neměly podobné informační cíle.
Pokud je integrace dat prováděna pro účely výzkumu, obvykle jde mnohem plynuleji. Když jeden výzkumný pracovník poskytne přístup ke svým informacím jinému, obě strany obecně zkoumají stejný proces. To znamená, že budou používat podobné metody k katalogizaci a ukládání svých dat.
V minulosti byla integrace dat relativně malou oblastí datových studií, ale to se změnilo od počátku 21. století. S tím, jak se bezplatné online databáze stávají stále populárnějšími a přesnějšími, společnosti se snaží získat informace ve formátu pro sdílení To jim umožňuje zveřejňovat informace ve veřejné podobě a integrovat soukromé verze známých veřejných rozhraní do svých systémů.