Was ist eine Schemaübereinstimmung?

Der Schemaabgleich ist eine Technik, mit der zwei oder mehr komplexe Datenbanken oder Informationssätze ineinander verschmolzen werden. Da die Verwendung von Datenbanken und elektronischem Informationsspeicher über das Internet immer umfangreicher und komplexer wird, müssen Methoden zum Zusammenführen von Datensätzen von einer Datenbank zu einer anderen definiert werden, und der Schemaabgleich ist eine solche Technik. Das Konzept ist einfach, aber die Realität der Datenzusammenführung ist ziemlich komplex.

Der Begriff "Schemaabgleich" wird synonym mit "Schemaabgleich" verwendet, da Benutzer tatsächlich Daten abgleichen und sie nicht abgleichen. Zwei oder mehr Datenbanken werden zusammen abgebildet und ähnliche Aspekte jeder Datenbank werden ineinander abgebildet. Die häufigste Methode zum Zusammenführen von Daten ist die Verwendung genauer Verweise. Ein Beispiel für diesen Zusammenführungsstil ist das Kombinieren der Namensspalte einer Datenbank mit der Namensspalte einer anderen Datenbank.

Das Zusammenführen ist für Menschen oder Computer normalerweise nicht so einfach. Da so viele Daten gefiltert, kombiniert und verwendet werden müssen, ist es wichtig, dass nur eine Datenbank statt mehrerer Datenbanken vorhanden ist. Die Schemazuordnung konzentriert sich darauf, diesen langwierigen Prozess automatisiert und effizienter zu gestalten. Ein Beispiel dafür, wo ein Schemaabgleich erforderlich ist, könnte sein, dass eine Datenbank ein Feld "Hauptfach des Schülers" und eine andere Datenbank ein Feld "Studienfach des Schülers" enthält. Es sind die gleichen Informationen, aber die leicht unterschiedlichen Titel erschweren das Zusammenführen.

Der Schemaabgleich unterteilt diesen komplexen Prozess des Zusammenführens von Datenbanken in vier Schritte: Vorintegration, Vergleich, Anpassung und Zusammenführung. Bevor mehrere Datenbanken zusammengeführt werden können, müssen sie auf Ähnlichkeiten und Unterschiede analysiert werden. Im Bereich des Schemaabgleichs wird dies als Vorintegration bezeichnet. Der Computer beginnt, die effizienteste Integrationsmethode zu ermitteln.

Als nächstes bewertet der Computer die Schemata, indem er sie auf einer detaillierteren Ebene miteinander vergleicht. Im Vergleichsschritt überprüft der Computer jeden Datenbankeintrag und stellt fest, wo Konflikte auftreten können. Ein Beispiel hierfür ist, wenn in einem Feld "Interesse des Schülers" "Arzt" und in einer anderen Datenbank "Arzt" aufgeführt sind. Eine Person würde wahrscheinlich erkennen, dass die Informationen identisch sind, bei Datenbanktools handelt es sich jedoch um zwei separate Einheiten.

Sobald der Computer alle potenziellen Konflikte ermittelt hat, kann er versuchen, die Probleme zu beheben. Dies kann so einfach wie das Ändern aller Instanzen von "Arzt" in "Arzt" sein. In Wirklichkeit ist der Prozess wesentlich komplexer.

Sobald alle Konflikte behoben wurden, kann der Computer die Daten im Schemaabgleichsprozess zusammenführen. In dieser Phase werden zwei oder mehr Datenbanken zu einer großen Datenbank zusammengeführt. Wenn alles gut geht, treten während der Integration und des zukünftigen Zugriffs auf die Datenbank keine Konflikte oder Fehler auf.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?