Vad matchar schemat?
Schemamatchning är en teknik som används för att slå samman två eller flera komplexa databaser eller uppsättningar av information till varandra. När användningen av databaser och elektronisk informationslagring blir större och mer komplex via Internet måste det definieras metoder för att sammanfoga uppsättningar av data från en databas till en annan, och schemamatchning är en sådan teknik. Konceptet är enkelt, men verkligheten i sammanslagning av data är ganska komplex.
Termen "schemat matchning" används synonymt med "schema mapping," eftersom användare faktiskt mappar data, inte matchar dem. Två eller flera databaser kartläggs tillsammans och liknande aspekter av varje databas mappas in i varandra. Det vanligaste sättet att slå samman data är att använda exakta referenser. Ett exempel på denna typ av sammanslagning är att kombinera namnkolumnen i en databas med namnskolumnen i en annan databas.
Sammanfogning är vanligtvis inte så enkelt för människor eller datorer. Med så mycket data som behöver filtreras, kombineras och användas, är det viktigt att ha en databas snarare än flera databaser. Schema mapping fokuserar på att göra denna tråkiga process automatiserad och effektivare. Ett exempel på där schemamatchning är nödvändig kan vara när en databas har ett "studentens huvudfält" och en annan databas har ett "studentens fält för studier". Det är samma information, men de lite olika titlarna komplicerar ansträngningarna att blanda den.
Schema-matchning delar upp denna komplexa process för att slå samman databaser i fyra steg: pre-integration, jämförelse, överensstämmelse och sammanslagning. Innan flera databaser kan slås samman måste de analyseras för likheter och skillnader. Inom ramen för schemamatchning kallas detta förintegration. Datorn börjar bestämma den mest effektiva integrationsmetoden.
Därefter utvärderar datorn scheman genom att jämföra dem med varandra på en mer detaljerad nivå. I jämförelsesteget tittar datorn på varje databaspost och avgör var det kan vara konflikter. Ett exempel på detta är när ett "studentintresse" -fält listar "läkare" och en annan databas visar det som "läkare". En person kanske förstår att informationen är densamma men för databasverktyg är de två separata enheter.
När datorn har fastställt alla potentiella konflikter kan den gå vidare med att försöka lösa problemen. Detta kan vara så enkelt som att ändra alla instanser av "läkare" till "läkare". I verkligheten är processen väsentligt mer komplex.
När alla konflikter har åtgärdats kan datorn fortsätta med att slå samman data i schemamatchningsprocessen. I detta skede slås två eller flera databaser samman till en stor databas. Om allt går bra inträffar inga konflikter eller fel under integrationen och framtida åtkomst till databasen.