Vad är semantisk integration?
"Semantisk integration" är en term som används i flera sammanhang inom olika områden inom datordesign, programmering, hantering och administration. I allmänhet hänvisar det till att samla information från en eller flera olika källor för att skapa ett system där informationen är organiserad på ett sätt som är vettigt för en användare. Semantisk integration handlar ofta om att definiera och etablera metadataförbindelser, eller relationer, mellan olika delar av de olika datakällorna så att de kan vara logiskt strukturerade. Det kan handla om att skapa relationella förbindelser mellan två separata databaser, bygga en graf över hur delar av olika webbplatser förhåller sig till varandra eller integrera faktadata från ett okänt, godtyckligt format i en kortfattad poststruktur. Många praktiska tillämpningar för ett fullt implementerat semantiskt integrationssystem finns, inklusive forskningsbibliotek eller nätverk, mer organiska sökmotoralgoritmer som kan extrapolera sammanhang från en sökning och, i slutändan - genom användning av metadata-publicering - sömlös integration av olika datorsystem för datautbyte .
Det ultimata målet med semantisk integration i de flesta fall är att kunna associera information på ett dynamiskt sätt. I ett mycket enkelt exempel kan detta innebära att man kan associera fält i en databas med fält i en annan databas, trots att de inte är exakta matchningar, som att relatera ett fält med namnet ”storlek” till ett fält som heter ”höjd”. Denna associering kan utföras genom användardefinierade regler som specifikt länkar de två, eller det kan göras med algoritmer som jämför de numeriska data för fälten och bestämmer en sannolik matchning. Orden "storlek" och "höjd" blir då metadatatermer som andra externa semantiska integrationssystem kanske kan använda för att hitta informationen för en användare utan att behöva veta specifikt hur ett enda system lagrar data.
I komplexa semantiska integrationssystem, till exempel de som är utformade för forskning, är metadatapublicering och delning en viktig komponent för drift. Metadata kan tas bort från dokument för att bilda stora relationella datastrukturer som kan hjälpa till med frågor. Detta innebär att forskningsartiklar om vilket ämne som helst kan integreras i ett system som mäter och registrerar frekvensen för ord, och dessa ord kan hjälpa till i användarsökningar efter information, vilket gör att relaterade ämnen kan listas från valfri källa utan behov av specifika konverteringar.
En av de utmaningar som designers av semantiska integrationssystem står inför är hur man samlar data. Att använda människor för att klassificera och skapa relationer mellan data från olika källor kan vara tidskrävande och i slutändan mycket beroende av personens individuella upplevelser. När algoritmer används för att automatiskt göra associeringar kan vissa relationer förbises på grund av någon mindre skillnad som algoritmen inte kan lösa. En metod för att implementera semantisk integration i stor skala använder inlärningsbaserade algoritmer i samband med mänsklig baserad reglerhantering och i vissa fall faktiska mänskliga beslutsfattande under processen.