Che cosa corrisponde allo schema?

La corrispondenza dello schema è una tecnica utilizzata per unire due o più database o insiemi di informazioni complessi tra loro. Man mano che l'uso di database e l'archiviazione elettronica delle informazioni diventa più grande e complessa attraverso Internet, è necessario definire metodi per unire gruppi di dati da un database all'altro e la corrispondenza dello schema è una di queste tecniche. Il concetto è semplice, ma la realtà della fusione dei dati è piuttosto complessa.

Il termine "corrispondenza dello schema" è usato come sinonimo di "mappatura dello schema", poiché gli utenti in realtà mappano i dati, non li corrispondono. Due o più database sono mappati insieme e aspetti simili di ciascun database sono mappati l'uno nell'altro. Il modo più comune per unire i dati è utilizzare riferimenti esatti. Un esempio di questo stile di unione è la combinazione della colonna del nome di un database con la colonna del nome di un altro database.

La fusione di solito non è così semplice, per persone o computer. Con così tanti dati che devono essere filtrati, combinati e usati, avere un database piuttosto che più database è essenziale. La mappatura degli schemi si concentra sul rendere questo processo noioso automatizzato e più efficiente. Un esempio di dove è necessaria la corrispondenza dello schema potrebbe essere quando un database ha un campo "principale dello studente" e un altro database ha un campo "campo di studio dello studente". Sono le stesse informazioni, ma i titoli leggermente diversi complicano gli sforzi per fonderli.

La corrispondenza dello schema interrompe questo complesso processo di fusione dei database in quattro fasi: pre-integrazione, confronto, conformità e fusione. Prima di poter unire più database, è necessario analizzarli per similitudini e differenze. Nel regno della corrispondenza dello schema, questo è noto come pre-integrazione. Il computer inizia a determinare il metodo di integrazione più efficiente.

Successivamente, il computer valuta gli schemi confrontandoli tra loro a un livello più dettagliato. Nella fase di confronto, il computer esamina ciascuna voce del database e determina dove potrebbero esserci dei conflitti. Un esempio di ciò è quando un campo "interesse dello studente" elenca "medico" e un altro database lo elenca come "medico". Una persona probabilmente riconoscerebbe le informazioni come uguali ma, per gli strumenti di database, sono due entità separate.

Una volta che il computer ha determinato tutti i potenziali conflitti, può procedere con il tentativo di risolvere i problemi. Questo può essere semplice come cambiare tutte le istanze di "medico" in "medico". In realtà, il processo è sostanzialmente più complesso.

Una volta risolti tutti i conflitti, il computer può procedere alla fusione dei dati nel processo di abbinamento dello schema. In questa fase, due o più database vengono uniti in un unico database di grandi dimensioni. Se tutto va bene, non si verificheranno conflitti o errori durante l'integrazione e l'accesso futuro al database.

Che cosa corrisponde allo schema?

Questo articolo è stato utile?