Co to jest dopasowanie schematu?
Dopasowywanie schematów to technika stosowana do łączenia ze sobą dwóch lub więcej złożonych baz danych lub zestawów informacji. Ponieważ korzystanie z baz danych i elektronicznego przechowywania informacji staje się coraz większe i bardziej złożone przez Internet, muszą zostać zdefiniowane metody łączenia zestawów danych z jednej bazy danych do drugiej, a dopasowywanie schematów jest jedną z takich technik. Koncepcja jest prosta, ale rzeczywistość łączenia danych jest dość złożona.
Termin „dopasowanie schematu” jest używany synonimicznie z „mapowaniem schematu”, ponieważ użytkownicy faktycznie mapują dane, nie pasując do nich. Dwie lub więcej baz danych jest zmapowanych razem, a podobne aspekty każdej bazy danych są zmapowane względem siebie. Najczęstszym sposobem scalania danych jest użycie dokładnych odniesień. Przykładem tego stylu łączenia jest połączenie kolumny nazwy jednej bazy danych z kolumną nazwy innej bazy danych.
Scalanie zwykle nie jest takie proste dla ludzi ani komputerów. Przy tak dużej ilości danych, które muszą być filtrowane, łączone i wykorzystywane, niezbędna jest jedna baza danych, a nie wiele baz danych. Mapowanie schematów koncentruje się na zautomatyzowaniu i usprawnieniu tego żmudnego procesu. Przykładem, w którym konieczne jest dopasowanie schematu, może być sytuacja, gdy jedna baza danych ma pole „główne” studenta, a inna baza danych ma pole „studenckie”. To ta sama informacja, ale nieco inne tytuły komplikują wysiłki, aby je połączyć.
Dopasowanie schematu dzieli ten złożony proces scalania baz danych na cztery etapy: wstępna integracja, porównanie, zgodność i scalanie. Przed połączeniem wielu baz danych należy je przeanalizować pod kątem podobieństw i różnic. W dziedzinie dopasowywania schematów nazywa się to integracją wstępną. Komputer zaczyna określać najbardziej wydajną metodę integracji.
Następnie komputer ocenia schematy, porównując je ze sobą na bardziej szczegółowym poziomie. W kroku porównania komputer sprawdza każdą pozycję bazy danych i określa, gdzie mogą występować konflikty. Przykładem tego jest sytuacja, gdy w polu „zainteresowania studenta” znajduje się „lekarz”, aw innej bazie danych jest to „lekarz”. Osoba prawdopodobnie rozpoznałaby te informacje jako takie same, ale w przypadku narzędzi baz danych są to dwa odrębne podmioty.
Gdy komputer wykryje wszystkie potencjalne konflikty, może iść naprzód, próbując rozwiązać problemy. Może to być tak proste, jak zmiana wszystkich wystąpień „lekarza” na „lekarza”. W rzeczywistości proces ten jest znacznie bardziej złożony.
Po usunięciu wszystkich konfliktów komputer może kontynuować scalanie danych w procesie dopasowywania schematu. Na tym etapie dwie lub więcej baz danych jest łączonych w jedną dużą bazę danych. Jeśli wszystko pójdzie dobrze, nie wystąpią żadne konflikty ani błędy podczas integracji i przyszłego dostępu do bazy danych.