Skip to main content

Was ist das Schema -Matching?

Schema -Matching ist eine Technik, mit der zwei oder komplexere Datenbanken oder Informationssätze ineinander zusammengeführt werden.Da die Verwendung von Datenbanken und elektronischer Informationsspeicher im Internet größer und komplexer wird, muss definierte Methoden zum Zusammenführen von Datensätzen von einer Datenbank zur anderen vorhanden sein, und das Schema -Matching ist eine solche Technik.Das Konzept ist einfach, aber die Realität des Datenverführens ist ziemlich komplex.

Das Begriffschema -Matching wird synonym mit der Schema -Mapping verwendet, da Benutzer tatsächlich Daten abbilden und sie nicht übereinstimmen.Zwei oder mehr Datenbanken werden miteinander abgebildet und ähnliche Aspekte jeder Datenbank werden ineinander abgebildet.Der häufigste Weg, um Daten zu verschmelzen, besteht darin, genaue Referenzen zu verwenden.Ein Beispiel für diesen Zusammenführungsstil ist die Kombination der Namensspalte einer Datenbank mit der Namensspalte einer anderen Datenbank.

Das Zusammenführen ist für Personen oder Computer normalerweise nicht so einfach.Bei so vielen Daten, die gefiltert, kombiniert und verwendet werden müssen, ist es unerlässlich, eine Datenbank anstelle mehrerer Datenbanken zu haben.Das Schema -Mapping konzentriert sich darauf, diesen mühsamen Prozess automatisiert und effizienter zu gestalten.Ein Beispiel dafür, wo ein Schema -Matching erforderlich ist, könnte sein, wenn in einer Datenbank ein Hauptfeld des Schülers und eine andere Datenbank über das Gebiet eines Schülers des Studienbereichs verfügt.Die gleichen Informationen, aber die etwas unterschiedlichen Titel erschweren die Bemühungen, sie zu mischen.Bevor mehrere Datenbanken zusammengeführt werden können, müssen sie auf Ähnlichkeiten und Unterschiede analysiert werden.Im Bereich des Schemasanpassung wird dies als Vorintegration bezeichnet.Der Computer beginnt, die effizienteste Integrationsmethode zu bestimmen.

Als nächstes bewertet der Computer die Schemata, indem sie sie auf detaillierterer Ebene miteinander vergleichen.Im Vergleichschritt untersucht der Computer jeden Datenbankeintrag und bestimmt, wo es Konflikte geben kann.Ein Beispiel hierfür ist, wenn das Interessenfeld eines Schülers Arzt und eine andere Datenbank als Arzt auflistet.Eine Person würde die Informationen wahrscheinlich als gleich erkennen, aber für Datenbank -Tools sind sie zwei separate Einheiten.

Sobald der Computer alle potenziellen Konflikte festgelegt hat, kann sie mit dem Versuch, die Probleme zu lösen, voranschreiten.Dies kann so einfach sein wie alle Instanzen des Arztes zum Arzt.In Wirklichkeit ist der Prozess wesentlich komplexer.

Sobald alle Konflikte festgelegt wurden, kann der Computer die Daten im Schema-Matching-Prozess zusammenführen.Zu diesem Zeitpunkt werden zwei oder mehr Datenbanken in eine große Datenbank verschmolzen.Wenn alles gut läuft, werden während der Integration und des zukünftigen Zugriffs auf die Datenbank keine Konflikte oder Fehler auftreten.