Hva er semantisk integrasjon?

"Semantisk integrasjon" er et begrep som brukes i flere sammenhenger på tvers av forskjellige områder av datamaskindesign, programmering, styring og administrasjon. Generelt refererer det til å samle informasjon fra en eller flere forskjellige kilder med det formål å lage et system der informasjonen er organisert på en måte som gir mening for en bruker. Semantisk integrasjon omhandler ofte å definere og etablere metadatatilkoblinger, eller forhold, mellom forskjellige deler av de forskjellige datakildene slik at de kan være logisk strukturert. Dette kan innebære å skape relasjonelle forbindelser mellom to separate databaser, bygge en graf over hvordan deler av forskjellige nettsteder forholder seg til hverandre, eller integrerer faktiske data fra et ukjent, vilkårlig format til en kortfattet journalstruktur. Det finnes mange praktiske applikasjoner for et fullt implementert semantisk integrasjonssystem, inkludert forskningsbiblioteker eller nettverk, mer organiske søkemotoralgoritmer som kan ekstrapolere kontekst from et søk og til slutt - gjennom bruk av metadata -publisering - sømløs integrering av forskjellige datasystemer for datautveksling.

Det endelige målet med semantisk integrasjon i de fleste tilfeller er å kunne knytte informasjon på en dynamisk måte. I et veldig enkelt eksempel kan dette bety å kunne knytte felt i en database med felt i en annen database, til tross for at de ikke er eksakte kamper, for eksempel å relatere et felt som heter "størrelse" til et felt som heter "høyde". Denne foreningen kan utføres gjennom brukerdefinerte regler som spesifikt knytter de to, eller den kan gjøres med algoritmer som sammenligner de numeriske dataene til feltene og bestemmer en sannsynlig kamp. Ordene "størrelse" og "høyde" blir da metadata -termer som andre eksterne semantiske integrasjonssystemer kan være i stand til å bruke for å finne informasjonen for en bruker uten å måtte vite spesifikasjoncally hvordan et enkelt system lagrer dataene.

I komplekse semantiske integrasjonssystemer, for eksempel de som er designet for forskning, er metadata -publikasjon og deling en nøkkelkomponent for operasjon. Metadata kan hentes fra dokumenter for å danne store relasjonsdatastrukturer som kan hjelpe til med spørsmål. Dette betyr at forskningsartikler om et hvilket som helst emne kan integreres i et system som måler og registrerer hyppigheten av ord, og disse ordene kan hjelpe til i brukersøk etter informasjon, slik at relaterte emner kan oppføres fra noen kilde uten behov for spesifikke konverteringer.

En av utfordringene som møter designere av semantiske integrasjonssystemer er hvordan man samler dataene. Å bruke mennesker til å klassifisere og gjøre forholdet mellom data fra forskjellige kilder kan være tidkrevende og til slutt veldig avhengige av personens individuelle opplevelser. Når algoritmer brukes til automatisk å lage assosiasjoner, kan visse forhold bli oversett på grunn av noen mindre forskjelligeence at algoritmen ikke er i stand til å løse. En metode for å implementere semantisk integrasjon i stor skala bruker læringsbaserte algoritmer i forbindelse med menneskelig-basert regelsadministrasjon og i noen tilfeller faktisk menneskelig beslutningstaking under prosessen.

ANDRE SPRÅK