Skip to main content

Что такое программное обеспечение хранилища данных?

За последние несколько лет программное обеспечение для хранилищ данных выросло в геометрической прогрессии, и ожидается, что в будущем рост будет выше среднего. Хранилище данных - это хранилище всех транзакционных данных организации или компании. Основное назначение хранилища данных - анализ транзакций и составление сложных отчетов.

В каждом программном продукте хранилища данных есть три основные функции: извлечение данных, создание структуры базы данных и создание пользовательских запросов. В индустрии информационных технологий специалисты по хранилищам данных известны как специалисты по бизнес-аналитике. Как правило, они имеют опыт работы в области математики, статистики или анализа компьютерной системы. Дополнительное обучение часто требуется для реляционных баз данных, архитектуры системы и основ программирования баз данных.

Одной из наиболее важных функций любого программного обеспечения хранилища данных является способность правильно извлекать и структурировать данные из различных источников. Это часто называют инструментом извлечения, преобразования и загрузки (ETL). Хранилища данных должны быть заполнены данными из системы транзакций таким образом, чтобы поддерживать целостность и взаимосвязь данных, позволяя персоналу настраивать извлекаемые данные. Это неотъемлемая часть архитектуры системы.

Важно отметить, что большинство программ для хранилищ данных используются для создания, поддержки и обслуживания нескольких наборов данных. Во многих ситуациях некоторые таблицы дублируются во всех кубах, в то время как существуют другие наборы данных, которые должны оставаться отдельными и различными. Например, куб данных с данными о закупках будет иметь много общих точек данных с кубом платежей поставщиков. Тем не менее, в каждом кубе также будет ряд конкретной информации, которая применяется только к этому конкретному кубу.

Архитектор данных отвечает за идентификацию общих данных, подтверждение их правильности и обеспечение доступности этой информации в нескольких кубах без ущерба для целостности каждого куба. Кроме того, он или она отвечает за управление процессом загрузки данных, необходимым для обновления кубов данных. Это может быть автоматический или ручной процесс, в зависимости от сложности кубов и способа предоставления данных.

Все программы хранилища данных поставляются с рядом стандартных отчетов и запросов. Эти отчеты основаны на общих бизнес-потребностях и имеют общий характер. Например, отчет о первой десятке клиентов по объему продаж за текущий год является распространенным запросом отчета и будет стандартным в большинстве программ.

Однако многие фирмы считают, что они требуют создания пользовательских отчетов для удовлетворения конкретных потребностей. Например, один и тот же отчет о продажах может включать имена торговых представителей и сортировку данных по конкретным районам или территориям. Возможность быстро создавать пользовательский отчет и адаптировать его к существующим бизнес-потребностям имеет важное значение для успеха этого типа программного обеспечения.