¿Qué es la correspondencia de esquemas?
La coincidencia de esquemas es una técnica utilizada para fusionar dos o más bases de datos complejas o conjuntos de información entre sí. A medida que el uso de bases de datos y el almacenamiento de información electrónica se hace más grande y más complejo a través de Internet, debe haber métodos definidos para fusionar conjuntos de datos de una base de datos a otra, y la coincidencia de esquemas es una de esas técnicas. El concepto es simple, pero la realidad de la fusión de datos es bastante compleja.
El término "coincidencia de esquema" se usa como sinónimo de "asignación de esquema", porque los usuarios en realidad asignan datos, no los coinciden. Dos o más bases de datos se asignan juntas y aspectos similares de cada base de datos se asignan entre sí. La forma más común de fusionar datos es mediante el uso de referencias exactas. Un ejemplo de este estilo de fusión es combinar la columna de nombre de una base de datos con la columna de nombre de otra base de datos.
La fusión no suele ser tan simple, para personas o computadoras. Con tantos datos que necesitan ser filtrados, combinados y utilizados, es esencial tener una base de datos en lugar de múltiples. El mapeo de esquemas se enfoca en hacer que este tedioso proceso sea automatizado y más eficiente. Un ejemplo de dónde es necesaria la coincidencia de esquemas podría ser cuando una base de datos tiene un campo de "estudiante principal" y otra base de datos tiene un campo de "campo de estudio del estudiante". Es la misma información, pero los títulos ligeramente diferentes complican los esfuerzos para combinarla.
La coincidencia de esquemas divide este complejo proceso de fusión de bases de datos en cuatro pasos: preintegración, comparación, conformidad y fusión. Antes de poder combinar varias bases de datos, es necesario analizarlas en busca de similitudes y diferencias. En el ámbito de la coincidencia de esquemas, esto se conoce como preintegración. La computadora comienza a determinar el método de integración más eficiente.
Luego, la computadora evalúa los esquemas comparándolos entre sí a un nivel más detallado. En el paso de comparación, la computadora observa cada entrada de la base de datos y determina dónde puede haber conflictos. Un ejemplo de esto es cuando un campo de "interés del estudiante" enumera "médico" y otra base de datos lo enumera como "médico". Es probable que una persona reconozca la información como la misma pero, para las herramientas de base de datos, son dos entidades separadas.
Una vez que la computadora ha determinado todos los conflictos potenciales, puede avanzar tratando de resolver los problemas. Esto puede ser tan simple como cambiar todas las instancias de "médico" a "médico". En realidad, el proceso es sustancialmente más complejo.
Una vez que se han solucionado todos los conflictos, la computadora puede proceder a fusionar los datos en el proceso de coincidencia de esquema. En esta etapa, dos o más bases de datos se fusionan en una gran base de datos. Si todo va bien, no se producirán conflictos ni errores durante la integración y el acceso futuro a la base de datos.