¿Qué es la arquitectura del almacén de datos?

La arquitectura del almacén de datos es un diseño que encapsula todas las facetas del almacenamiento de datos para un entorno empresarial. El almacenamiento de datos es la creación de un dominio central para almacenar datos empresariales complejos y descentralizados en una unidad lógica que permite la minería de datos, la inteligencia empresarial y el acceso general a todos los datos relevantes dentro de una organización. La arquitectura del almacén de datos incluye todos los requisitos de informes, gestión de datos, requisitos de seguridad, requisitos de ancho de banda y requisitos de almacenamiento.

Al crear una arquitectura de almacén de datos, es importante dividir la arquitectura en dominios específicos que se unen en un diseño final holístico. Este diseño debe considerarse la impresión azul para la arquitectura de datos empresariales. En particular, se deben desarrollar varias áreas principales al considerar la arquitectura del almacén de datos. Estas áreas son acceso al sistema de origen, proceso de área de estadificación, proceso de enriquecimiento de datos, arquitectura de datos, inteligencia empresarial PROcess y requisitos de almacenamiento.

El almacenamiento de datos requiere que los datos de origen se transfieran de una transaccional o base de datos de registro al almacén de datos. Este proceso se simplifica en el término transformación y carga de extracto (ETL), que básicamente encapsula las áreas de acceso al sistema de origen, enriquecimiento de datos y arquitectura de datos. En aras de la claridad, es mejor diseñar estas áreas arquitectónicas en detalle, lo que describe cómo se logrará el proceso ETL. Si bien se requieren algunos datos de los sistemas de origen, todos los datos no son deseables, ya que sobrecargaría el almacén empresarial. Las áreas principales de preocupación al abordar la capa del sistema de origen son las metodologías de acceso a datos, los datos requeridos del sistema de origen y los requisitos de actualización.

La siguiente capa arquitectónica de almacenamiento de datos a considerar es el proceso del área de preparación. Como la mayoría de los datos de los sistemas de origen volverán aQuire Validación y limpieza de datos, es importante crear una zona de aterrizaje para que los datos de origen residan antes de cargar en la capa de reglas comerciales del almacén de datos. El área de estadificación mantiene alimentos de datos sin procesar de los sistemas de origen que generalmente se estampan el tiempo para garantizar la reciente de los datos.

El proceso de enriquecimiento de datos o reglas comerciales es donde se limpian los datos para cumplir con el resultado deseado del almacén de datos. Un buen ejemplo de este enfoque de limpieza es utilizar herramientas de limpieza de direcciones; En caso de que el sistema de origen tenga datos incorrectos, el proceso de enriquecimiento de datos ejecutará la dirección desde el conjunto de datos sin procesar en un sistema de reglas comerciales que corregiría las direcciones no válidas. Este es también el momento en que los datos inexactos se eliminan o modifican para garantizar la integridad dentro del almacén de datos.

La siguiente capa a considerar es la capa de arquitectura de datos. Esta área es donde se completa el verdadero diseño o esquema del almacén de datos empresariales. Almacenamiento de datos en no unCombinación de todos los conjuntos de datos dentro de una empresa, pero en su lugar es una base de datos recientemente definida creada para habilitar una descripción general de todas las entidades comerciales dentro de la empresa.

Esto requiere que la arquitectura de datos responda las preguntas que planteará el negocio en el área de inteligencia empresarial y minería de datos. Al crear la arquitectura de datos de esta manera, los conjuntos de datos sin procesar se transformarán en tablas de hechos que permitirán a los usuarios realizar informes AD-hoc en toda la vista empresarial en lugar de una base de datos específica. Esta es también el área que mantendrá metadatos sobre los datos del sistema sin procesar, que podría incluir el nombre del sistema de origen o las claves primarias.

La siguiente área a considerar son los requisitos de inteligencia e informes de negocios. Esta capa puede considerarse como el requisito de orientación por el usuario para el almacenamiento de datos. Por lo general, esta área contiene informes enlatados, capacidad de informes ad-hoc y tableros o alertas de la empresa. El businLas capas de inteligencia ES normalmente obtienen la mayor consideración, ya que es el único componente orientado hacia afuera dentro del almacén de datos.

La capa final para su consideración son los requisitos generales de almacenamiento de datos y el mantenimiento. A medida que un almacén de datos continúa creciendo y expandiéndose, el almacenamiento de datos de la base de usuarios debe administrarse y mantener estrictamente. Además, mientras crea la arquitectura del almacén de datos, el diseño debe hacer estimaciones realistas sobre lo que se requerirá en forma de capacidad de almacenamiento de datos, así como una banda con capacidad de acceso a datos. Estos requisitos serán críticos a medida que el almacén de datos se use ampliamente en toda la empresa.

OTROS IDIOMAS