¿Qué es la integración de datos?
La integración de datos es la fusión de múltiples fuentes de datos en una sola fuente de datos. Esta práctica a menudo lleva mucho tiempo e involucrada, ya que las diferentes fuentes de datos probablemente son incompatibles entre sí. Las cosas tan simples como los diferentes nombres de columnas en una hoja de cálculo son suficientes para requerir la reformateo de la fecha. Este proceso es más común en situaciones en las que dos grupos comenzaron sin conexión, pero se colocan juntos después de haber trabajado de forma independiente. La integración de datos se ha convertido en un tema más importante debido a la prevalencia de fuentes de datos gratuitas y bases de datos en línea.
La parte de datos de la integración de datos puede ser casi cualquier cosa siempre que se almacene en un sistema informático. El contenido real de los datos rara vez es tan importante como la forma en que se almacenan los datos. La mayoría de las veces, los datos se mantienen en bases de datos, sistemas de información organizados. Estos sistemas contienen entradas y campos únicos que permiten a los usuarios encontrar información rápidamente.
El mayor obstáculo para cualquier datoEl proceso de integración son los datos en sí. En muchos casos, cuando los datos se configuraron por primera vez, no había intención de fusionar el conjunto de datos con otro. Esto significa que a pesar de que dos conjuntos de datos pueden referirse a lo mismo, son totalmente incompatibles.
Casi cualquier cosa hará que las bases de datos incompatibles. Algo tan simple como una diferencia en la presentación, como el orden de campo o el ancho de la columna, puede ser suficiente para evitar una fusión fácil. Cuando los datos son significativamente diferentes, como una base de datos que contiene más o menos información, la fusión es mucho más difícil.
Las dos situaciones que requieren la integración de datos más que cualquier otra están en el negocio y los campos de investigación. En el mundo de los negocios, la fusión de departamentos o empresas requiere combinar la información previamente separada en una sola estructura. Esta forma de integración es generalmente muy difícil a menos que el originalLos grupos usaron un software similar y tenían objetivos de información similares.
Cuando la integración de datos se realiza con fines de investigación, generalmente es mucho más suave. Cuando un investigador da acceso a su información a otra, las dos partes generalmente están investigando el mismo proceso. Esto significa que utilizarán métodos similares para catalogarse y almacenar sus datos.
En el pasado, la integración de datos era un área relativamente menor de estudios de datos, pero esto ha cambiado desde principios del siglo XXI. Con las bases de datos en línea gratuitas se vuelven más populares y precisas, las empresas están luchando para obtener su información en un formato compartible. Esto les permite divulgar su información en forma pública e integrar versiones privadas de interfaces públicas conocidas en sus sistemas.
.