Qu'est-ce que la correspondance de schéma?

La correspondance de schéma est une technique utilisée pour fusionner deux ou plusieurs bases de données complexes ou des ensembles d’informations. Au fur et à mesure que l'utilisation des bases de données et le stockage électronique des informations grandissent et se complexifient via Internet, il est nécessaire de définir des méthodes pour la fusion d'ensembles de données d'une base de données à une autre, et la mise en correspondance de schémas en est une. Le concept est simple, mais la réalité de la fusion de données est assez complexe.

Le terme "correspondance de schéma" est utilisé comme synonyme de "mappage de schéma", car les utilisateurs mappent des données et ne les correspondent pas. Deux ou plusieurs bases de données sont mappées ensemble et des aspects similaires de chaque base de données sont mappés l'un sur l'autre. Le moyen le plus courant de fusionner des données consiste à utiliser des références exactes. Un exemple de ce style de fusion combine la colonne de nom d'une base de données avec la colonne de nom d'une autre base de données.

La fusion n’est généralement pas aussi simple, ni pour les personnes ni pour les ordinateurs. Avec autant de données devant être filtrées, combinées et utilisées, il est essentiel de disposer d’une base de données plutôt que de plusieurs. La cartographie de schéma vise à rendre ce processus fastidieux automatisé et plus efficace. Une correspondance de schéma est par exemple nécessaire lorsqu'une base de données comporte un champ "principal de l'étudiant" et qu'une autre base de données comporte un champ "domaine d'étude de l'étudiant". C'est la même information, mais les titres légèrement différents compliquent les efforts pour la mélanger.

La correspondance de schéma divise ce processus complexe de fusion de bases de données en quatre étapes: pré-intégration, comparaison, conformité et fusion. Avant de pouvoir fusionner plusieurs bases de données, elles doivent être analysées pour rechercher des similitudes et des différences. Dans le domaine de la correspondance de schéma, on parle de pré-intégration. L'ordinateur commence à déterminer la méthode d'intégration la plus efficace.

Ensuite, l’ordinateur évalue les schémas en les comparant les uns aux autres à un niveau plus détaillé. Au cours de l'étape de comparaison, l'ordinateur examine chaque entrée de base de données et détermine les éventuels conflits. Un exemple de ceci est lorsqu'un champ "intérêt de l'étudiant" liste "docteur" et qu'une autre base de données le nomme "médecin". Une personne reconnaîtrait probablement les informations comme étant identiques, mais, pour les outils de base de données, il s’agit de deux entités distinctes.

Une fois que l'ordinateur a déterminé tous les conflits potentiels, il peut continuer à essayer de résoudre les problèmes. Cela peut être aussi simple que de changer tous les exemples de "médecin" en "médecin". En réalité, le processus est beaucoup plus complexe.

Une fois tous les conflits résolus, l'ordinateur peut fusionner les données dans le processus de correspondance de schéma. A ce stade, deux bases de données ou plus sont fusionnées dans une base de données volumineuse. Si tout se passe bien, aucun conflit ni aucune erreur ne se produira lors de l'intégration et de l'accès futur à la base de données.

DANS D'AUTRES LANGUES

Cet article vous a‑t‑il été utile ? Merci pour les commentaires Merci pour les commentaires

Comment pouvons nous aider? Comment pouvons nous aider?