Skip to main content

Какие существуют типы типов хранилищ данных?

Хранилища данных хранят огромные объемы данных для использования во многих различных областях. Существует два основных типа дизайна хранилища данных: сверху вниз и снизу вверх. Две конструкции имеют свои преимущества и недостатки. Реализация снизу вверх проще и дешевле, но она менее полная, а корреляция данных носит более эпизодический характер. В нисходящем дизайне связи между данными очевидны и хорошо известны, но данные могут быть устаревшими, и внедрение системы обходится дорого.

Витрины данных являются центральной фигурой в дизайне хранилища данных. Киоск данных - это набор данных, основанный на единой концепции. Каждый витрина данных является уникальным и полным подмножеством данных. Каждая из этих коллекций полностью коррелируется внутри и часто имеет связи с внешними витринами данных.

То, как обрабатываются витрины данных, является основным отличием двух стилей проектирования хранилища данных. В нисходящем дизайне витрины данных происходят естественным образом при вводе данных в систему. В восходящем дизайне витрины данных создаются напрямую и соединяются вместе, образуя хранилище. Хотя это может показаться незначительной разницей, это создает совершенно другой дизайн.

Нисходящим методом был оригинальный дизайн хранилища данных. Используя этот метод, вся информация, хранящаяся в организации, помещается в систему. Каждый широкий предмет будет иметь свою общую область в базах данных. По мере использования данных будут появляться соединения между точками соответствующих данных и витрины данных. Кроме того, любые данные в системе остаются там навсегда - даже если данные заменяются или тривиализируются более поздней информацией, они будут оставаться в системе как запись прошлых событий.

Восходящий метод проектирования хранилища данных работает с противоположной стороны. Компания вводит информацию в качестве отдельного витрина данных. С течением времени в систему добавляются другие наборы данных, либо как их собственный витрина данных, либо как часть уже существующего. Когда два витрины данных считаются достаточно связанными, они объединяются в один блок.

Каждое из двух хранилищ данных имеет свои сильные и слабые стороны. Нисходящий метод - это огромный проект для еще меньших наборов данных. Поскольку крупные проекты также более дорогостоящие, они являются самыми дорогими с точки зрения денег и рабочей силы. Если хранилище данных завершено и поддерживается, это обширная коллекция, содержащая все, что знает компания.

Восходящий процесс намного быстрее и дешевле, но поскольку данные вводятся по мере необходимости, база данных никогда не будет завершена. Кроме того, корреляции между витринами данных настолько сильны, насколько их использование делает их. Если существует сильная корреляция, но пользователи ее не видят, она не связана.