Hva er dataintegrering?
Dataintegrasjon er sammenslåing av flere datakilder til en enkelt datakilde. Denne praksisen er ofte veldig tidkrevende og involvert, ettersom de forskjellige datakildene sannsynligvis er uforenlige med hverandre. Ting så enkle som forskjellige kolonnenavn på et regneark er nok til å kreve omformatering av dato. Denne prosessen er vanligst i situasjoner der to grupper startet uten forbindelse, men blir plassert sammen etter at de har jobbet uavhengig. Dataintegrasjon har blitt et viktigere tema på grunn av utbredelsen av gratis datakilder og online databaser.
Datadelen av dataintegrasjonen kan være nesten hva som helst så lenge den er lagret i et datasystem. Det faktiske innholdet i dataene er sjelden like viktig som måten dataene lagres på. Det meste av tiden blir dataene lagret i databaser, organiserte informasjonssystemer. Disse systemene inneholder unike oppføringer og felt som lar brukere raskt finne informasjon.
Det største hinderet for en hvilken som helst dataintegrasjonsprosess er selve dataene. I mange tilfeller, da dataene ble satt opp første gang, var det ingen intensjoner om å slå sammen datasettet med et annet. Dette betyr at selv om to datasett kan referere til samme ting, er de helt inkompatible.
Nesten hva som helst vil gjøre databaser uforenlige. Noe så enkelt som en forskjell i presentasjonen, som feltrekkefølge eller kolonnebredde, kan være nok til å forhindre en enkel fusjon. Når dataene er betydelig forskjellige, for eksempel en database som inneholder mer eller mindre informasjon, er sammenslåingen mye vanskeligere.
De to situasjonene som krever dataintegrering mer enn noen annen er i virksomheten og forskningsfeltene. I næringslivet krever sammenslåing av avdelinger eller selskaper å kombinere den tidligere separate informasjonen i en enkelt struktur. Denne formen for integrasjon er generelt veldig vanskelig, med mindre de opprinnelige gruppene brukte lignende programvare og hadde lignende informasjonsmål.
Når dataintegrering utføres for forskningsformål, går det generelt mye jevnere. Når en forsker gir tilgang til informasjonen sin til en annen, ser de to partene generelt på den samme prosessen. Dette betyr at de vil bruke lignende metoder for å katalogisere og lagre dataene sine.
Tidligere var dataintegrasjon et relativt lite område av datastudier, men dette har endret seg siden den tidlige delen av det 21. århundre. Med gratis online databaser som blir mer populære og nøyaktige, rusler selskaper for å få informasjonen i et delbart format. Dette lar dem både slippe informasjonen sin i en offentlig form og integrere private versjoner av kjente offentlige grensesnitt i systemene sine.