Was ist Schema Matching?

Schema -Matching ist eine Technik, mit der zwei oder komplexere Datenbanken oder Informationssätze ineinander zusammengeführt werden. Da die Verwendung von Datenbanken und elektronischer Informationsspeicher im Internet größer und komplexer wird, muss definierte Methoden zum Zusammenführen von Datensätzen von einer Datenbank zur anderen vorhanden sein, und das Schema -Matching ist eine solche Technik. Das Konzept ist einfach, aber die Realität des Datenverführens ist ziemlich komplex. Zwei oder mehr Datenbanken werden miteinander abgebildet und ähnliche Aspekte jeder Datenbank werden ineinander abgebildet. Der häufigste Weg, um Daten zu verschmelzen, besteht darin, genaue Referenzen zu verwenden. Ein Beispiel für diesen Zusammenführungsstil ist die Kombination der Namensspalte einer Datenbank mit der Namensspalte einer anderen Datenbank.

Zusammenführung ist normalerweise nicht so einfach für Personen oder Computer. Mit so vielen Daten, die gefiltert, kombiniert und verwendet werden müssen, haben O.NE -Datenbank anstelle mehrerer Datenbanken ist unerlässlich. Das Schema -Mapping konzentriert sich darauf, diesen mühsamen Prozess automatisiert und effizienter zu gestalten. Ein Beispiel dafür, wo ein Schema -Matching erforderlich ist, könnte sein, wenn eine Datenbank über ein Feld eines "Hauptsachen" und eine andere Datenbank über ein "Studienfeld" -Studienfeld verfügt. Es sind die gleichen Informationen, aber die etwas unterschiedlichen Titel erschweren die Bemühungen, sie zu mischen.

Schema-Matching unterteilt diesen komplexen Prozess des Zusammenführens von Datenbanken in vier Schritte: Vorintegration, Vergleich, Konformität und Verschmelzung. Bevor mehrere Datenbanken zusammengeführt werden können, müssen sie auf Ähnlichkeiten und Unterschiede analysiert werden. Im Bereich des Schemasanpassung wird dies als Vorintegration bezeichnet. Der Computer beginnt die effizienteste Integrationsmethode zu bestimmen.

Als nächstes bewertet der Computer die Schemata, indem sie sie auf detaillierterer Ebene miteinander vergleichen. Im Vergleich SteP, der Computer betrachtet jeden Datenbankeintrag und bestimmt, wo es Konflikte geben kann. Ein Beispiel hierfür ist, wenn das Feld "Interesse" eines Schülers "Arzt" und in einer anderen Datenbank als "Arzt" aufgeführt ist. Eine Person würde die Informationen wahrscheinlich als gleich erkennen, aber für Datenbank -Tools sind sie zwei separate Entitäten.

Sobald der Computer alle potenziellen Konflikte festgelegt hat, kann er mit dem Versuch, die Probleme zu lösen, voranschreiten. Dies kann so einfach sein wie alle Fälle von "Arzt" in "Doktor" zu ändern. In Wirklichkeit ist der Prozess wesentlich komplexer.

Sobald alle Konflikte festgelegt wurden, kann der Computer die Daten im Schema-Matching-Prozess zusammenführen. Zu diesem Zeitpunkt werden zwei oder mehr Datenbanken in eine große Datenbank verschmolzen. Wenn alles gut läuft, werden während der Integration und des zukünftigen Zugriffs auf die Datenbank keine Konflikte oder Fehler auftreten.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?