Vad matchar schema?
schema matchning är en teknik som används för att slå samman två eller flera komplexa databaser eller uppsättningar av information i varandra. När användningen av databaser och elektronisk informationslagring blir större och mer komplex via internet måste det definieras metoder för sammanslagning av data från en databas till en annan, och schema matchning är en sådan teknik. Konceptet är enkelt, men verkligheten av datafusion är ganska komplex.
Termen "schema som matchar" används synonymt med "schemmappning", eftersom användare faktiskt kartlägger data, inte matchar dem. Två eller flera databaser mappas ihop och liknande aspekter av varje databas mappas i varandra. Det vanligaste sättet att slå samman data är att använda exakta referenser. Ett exempel på denna sammanslagningsstil är att kombinera namnkolumnen i en databas med namnkolumnen i en annan databas.
sammanslagning är vanligtvis inte så enkelt, för människor eller datorer. Med så mycket data som behöver filtreras, kombineras och användas, med oNE -databas snarare än flera databaser är viktigt. Schema Mapping fokuserar på att göra denna tråkiga process automatiserad och effektivare. Ett exempel på var schemat matchning är nödvändig kan vara när en databas har ett "studentens huvudområde" och en annan databas har ett "studentfält" -fält. Det är samma information, men de något olika titlarna komplicerar ansträngningarna för att blanda den.
Schema-matchning bryter denna komplexa process för att slå samman databaser i fyra steg: förintegrering, jämförelse, överensstämmelse och sammanslagning. Innan flera databaser kan slås samman måste de analyseras för likheter och skillnader. På området för schema matchning kallas detta för före integrationen. Datorn börjar bestämma den mest effektiva integrationsmetoden.
Därefter utvärderar datorn systemen genom att jämföra dem med varandra på en mer detaljerad nivå. I jämförelsen SteP, datorn tittar på varje databaspost och bestämmer var det kan finnas konflikter. Ett exempel på detta är när ett "students intresse" -fält listar "läkare" och en annan databas listar det som "läkare." En person skulle sannolikt känna igen informationen som densamma, men för databasverktyg är de två separata enheter.
När datorn har bestämt alla potentiella konflikter kan den gå vidare med att försöka lösa problemen. Detta kan vara så enkelt som att ändra alla fall av "läkare" till "läkare". I verkligheten är processen väsentligt mer komplex.
När alla konflikter har fixats kan datorn fortsätta med att slå samman data i schematmatchningsprocessen. I detta skede slås två eller flera databaser samman i en stor databas. Om allt går bra kommer inga konflikter eller fel att uppstå under integration och framtida åtkomst till databasen.