Hvad matcher skemaet?

Skema matching er en teknik, der bruges til at flette to eller flere komplekse databaser eller informationssæt til hinanden. Efterhånden som brugen af ​​databaser og elektronisk informationslagring bliver større og mere kompleks gennem Internettet, skal der defineres metoder til at flette datasæt fra en database til en anden, og skema-matching er en sådan teknik. Konceptet er enkelt, men virkeligheden med datafusion er ret kompliceret.

Udtrykket "skema matching" bruges synonymt med "skema mapping", fordi brugere faktisk kortlægger data og ikke matcher dem. To eller flere databaser kortlægges sammen, og lignende aspekter af hver database kortlægges i hinanden. Den mest almindelige måde at flette data på er ved at bruge nøjagtige referencer. Et eksempel på denne sammensmeltningstilstand er at kombinere navnekolonnen i en database med navnekolonnen i en anden database.

Fusion er normalt ikke så enkelt for mennesker eller computere. Med så meget data, der skal filtreres, kombineres og bruges, er det nødvendigt at have en database snarere end flere databaser. Skemakortlægning fokuserer på at gøre denne kedelige proces automatiseret og mere effektiv. Et eksempel på, hvor skema-matching er nødvendig, kan være, når en database har et "studerendes større" felt, og en anden database har et "studerendes studiefelt" -felt. Det er de samme oplysninger, men de lidt forskellige titler komplicerer bestræbelserne på at blande dem.

Skema-matching deler denne komplekse proces med sammenlægning af databaser i fire trin: præintegration, sammenligning, konformering og sammenlægning. Inden flere databaser kan slås sammen, skal de analyseres for ligheder og forskelle. På området skema matching, er dette kendt som pre-integration. Computeren begynder at bestemme den mest effektive integrationsmetode.

Dernæst evaluerer computeren ordningerne ved at sammenligne dem med hinanden på et mere detaljeret niveau. I sammenligningstrinnet ser computeren på hver databaseindgang og bestemmer, hvor der kan være konflikter. Et eksempel på dette er, når en "studerendes interesse" -felt viser "læge", og en anden database viser det som "læge." En person vil sandsynligvis genkende oplysningerne som de samme, men for databaseværktøjer er de to separate enheder.

Når computeren har fundet alle de potentielle konflikter, kan den gå videre med at prøve at løse problemerne. Dette kan være så simpelt som at ændre alle tilfælde af "læge" til "læge." I virkeligheden er processen væsentligt mere kompleks.

Når alle konflikter er rettet, kan computeren fortsætte med at flette dataene i skema-matching-processen. På dette trin er to eller flere databaser fusioneret til en stor database. Hvis alt går godt, vil der ikke opstå konflikter eller fejl under integration og fremtidig adgang til databasen.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?