Hvad er semantisk integration?
"Semantisk integration" er et udtryk, der bruges i flere sammenhænge på tværs af forskellige områder inden for computerdesign, programmering, styring og administration. Generelt henviser det til sammenlægning af oplysninger fra en eller flere forskellige kilder med det formål at skabe et system, hvor informationen er organiseret på en måde, der giver mening for en bruger. Semantisk integration beskæftiger sig ofte med at definere og etablere metadataforbindelser eller relationer mellem forskellige dele af de forskellige datakilder, så de kan være logisk strukturerede. Dette kan omfatte oprettelse af relationelle forbindelser mellem to separate databaser, opbygning af en graf over, hvordan dele af forskellige websteder forholder sig til hinanden, eller integrering af faktuelle data fra et ukendt, vilkårligt format i en kortfattet poststruktur. Der findes mange praktiske applikationer til et fuldt implementeret semantisk integrationssystem, herunder forskningsbiblioteker eller netværk, mere organiske søgemaskinealgoritmer, der kan ekstrapolere kontekst fra en søgning og i sidste ende - ved hjælp af metadatapublicering - problemfri integration af forskellige computersystemer til dataudveksling .
Det ultimative mål med semantisk integration er i de fleste tilfælde at være i stand til at knytte information til en dynamisk måde. I et meget simpelt eksempel kan dette betyde at være i stand til at knytte felter i en database til felter i en anden database, på trods af det faktum, at de ikke er nøjagtige matchninger, såsom at tilknytte et felt kaldet "størrelse" til et felt med navnet "højde". Denne tilknytning kunne udføres gennem brugerdefinerede regler, der specifikt forbinder de to, eller det kan gøres med algoritmer, der sammenligner de numeriske data for felterne og bestemmer en sandsynlig match. Ordene "størrelse" og "højde" bliver derefter metadatabegreber, som andre eksterne semantiske integrationssystemer muligvis kan bruge til at finde informationen til en bruger uden at skulle vide specifikt, hvordan et enkelt system lagrer dataene.
I komplekse semantiske integrationssystemer, såsom dem, der er designet til forskning, er metadata-offentliggørelse og deling en nøglekomponent til drift. Metadata kan trækkes fra dokumenter for at danne store relationelle datastrukturer, der kan hjælpe med forespørgsler. Dette betyder, at forskningsartikler om ethvert emne kan integreres i et system, der måler og registrerer hyppigheden af ord, og at disse ord kan hjælpe i brugersøgning efter information, så der kan vises relaterede emner fra enhver kilde uden behov for specifikke konverteringer.
En af de udfordringer, som designere af semantiske integrationssystemer står overfor, er, hvordan man samler dataene. At bruge mennesker til at klassificere og skabe relationer mellem data fra forskellige kilder kan være tidskrævende og i sidste ende meget afhængig af personens individuelle oplevelser. Når algoritmer bruges til automatisk at oprette associeringer, kan visse relationer muligvis overses på grund af en mindre forskel, som algoritmen ikke kan løse. En metode til implementering af semantisk integration i stor skala bruger læringsbaserede algoritmer sammen med menneskebaseret regelforvaltning og i nogle tilfælde faktisk menneskelig beslutningstagning under processen.