Hvad er semantisk integration?
"Semantisk integration" er et udtryk, der bruges i flere sammenhænge på tværs af forskellige områder af computerdesign, programmering, styring og administration. Generelt henviser det til at samle oplysninger fra en eller flere forskellige kilder med det formål at oprette et eller andet system, hvor informationen er organiseret på en måde, der giver mening for en bruger. Semantisk integration handler ofte om at definere og etablere metadata -forbindelser eller forhold mellem forskellige dele af de forskellige datakilder, så de kan være logisk struktureret. Dette kan involvere at skabe relationelle forbindelser mellem to separate databaser, opbygge en graf over, hvordan dele af forskellige websteder relaterer til hinanden eller integrerer faktiske data fra et ukendt, vilkårligt format i en kortfattet rekordstruktur. Der findes mange praktiske anvendelser til et fuldt implementeret semantisk integrationssystem, herunder forskningsbiblioteker eller netværk, flere organiske søgemaskinalgoritmer, der kan ekstrapolere kontekst FRom en søgning og i sidste ende - gennem brug af metadata -udgivelse - problemfri integration af forskellige computersystemer til dataudveksling.
Det ultimative mål med semantisk integration i de fleste tilfælde er at være i stand til at knytte information på en dynamisk måde. I et meget simpelt eksempel kan dette betyde at være i stand til at knytte felter i en database med felter i en anden database, på trods af at de ikke er nøjagtige kampe, såsom at relatere et felt med navnet "størrelse" til et felt med navnet "højde". Denne forening kunne udføres gennem brugerdefinerede regler, der specifikt forbinder de to, eller det kunne gøres med algoritmer, der sammenligner de numeriske data på felterne og bestemmer en sandsynlig match. Ordene "størrelse" og "højde" bliver derefter metadata -udtryk, som andre eksterne semantiske integrationssystemer muligvis kan bruge til at finde oplysningerne til en bruger uden at skulle kende specifiCally hvordan et enkelt system gemmer dataene.
i komplekse semantiske integrationssystemer, såsom dem, der er designet til forskning, metadata -publikation og deling, er en nøglekomponent til drift. Metadata kan fjernes fra dokumenter til dannelse af store relationelle datastrukturer, der kan hjælpe med forespørgsler. Dette betyder, at forskningsartikler om ethvert emne kan integreres i et system, der måler og registrerer hyppigheden af ord, og disse ord kan hjælpe med brugersøgninger efter information, hvilket gør det muligt at opføre relaterede emner fra enhver kilde uden behov for specifikke konverteringer.
En af de udfordringer, som udsættes for designere af semantiske integrationssystemer, er, hvordan man samler dataene. Brug af mennesker til at klassificere og skabe forhold mellem data fra forskellige kilder kan være tidskrævende og i sidste ende meget afhængig af personens individuelle oplevelser. Når algoritmer bruges til automatisk at foretage foreninger, kan visse forhold overses på grund af nogle mindre forskelligeence, at algoritmen ikke er i stand til at løse. En metode til implementering af semantisk integration i stor skala bruger læringsbaserede algoritmer i forbindelse med menneskelig-baseret reglerstyring og i nogle tilfælde faktisk menneskelig beslutningstagning under processen.