Skip to main content

O que é um dispositivo de data warehouse?

Um dispositivo de armazém de dados é uma coleção integrada de hardware e software projetada para uma finalidade específica que normalmente envolve o alto rendimento de dados e funções analíticas. Geralmente consiste em servidores, sistemas operacionais, instalações de armazenamento de dados, sistemas de gerenciamento de banco de dados (DBMS) e software pré-instalado e otimizado para armazenamento de dados. Devido à sua relação custo-benefício e eficiência, o dispositivo de armazenamento de dados se tornou um segmento importante do mercado de data warehousing.

Uma organização pode usar um dispositivo de armazém de dados para otimizar várias áreas do processamento de dados. Em geral, seu principal objetivo é suplantar funções convencionais de inteligência de negócios, como armazenamento, extração, transformação, carga (ETL), análise e geração de relatórios. O mercado para esse tipo de solução rapidamente chamou a atenção de grandes concorrentes tradicionais, que são obrigados a fornecer a maioria, ou todos, de seu data warehousing ao mais alto nível de desempenho.

Alguns dispositivos de data warehouse no mercado são apenas aqueles que usam uma linguagem como SQL para facilitar a interação com o dispositivo no nível de solicitação de banco de dados. Um dispositivo de data warehouse verdadeiro geralmente é definido como aquele que não requer ajuste fino, indexação, particionamento ou agregação. Semelhante a um eletrodoméstico, é fácil de implantar e manter, oferecendo a capacidade de configurar um grande armazém de dados em um período de tempo relativamente curto.

Um dispositivo de data warehouse aproveita seu poder de processamento a partir de uma matriz de nós MPP (Massive Parallel Processing). Eles são implantados na chamada arquitetura de nada compartilhado , que fornece uma maneira eficaz de combinar vários nós em um ambiente altamente paralelo. Ao contrário das soluções tradicionais em que o custo e a complexidade de cada nó adicional impedem um alto nível de paralelismo por hardware, um dispositivo de armazém de dados é capaz de implantar centenas a milhares de nós de processamento de consultas em um pacote de dispositivo.

Aproveitando uma arquitetura de armazém de dados totalmente integrada, um dispositivo de armazém de dados pode oferecer uma vantagem significativa de desempenho, executando de 10 a 100 vezes mais rápido que os sistemas de data warehouse de uso geral. Essa arquitetura atribui ao baixo custo do dispositivo real, bem como à manutenção reduzida, pois não são necessários métodos de indexação ou tradicionais para ajustar o desempenho. Ele também atribui a baixos requisitos de refrigeração e energia, porque os processadores não são obrigados a lidar com grandes quantidades de dados.

Um dispositivo de data warehouse pode ter um enorme impacto positivo em uma empresa. Ele pode ajudar grandes organizações a organizar seu data warehouse de maneira mais eficiente, ajudando empresas de nível médio a resolver desafios de inteligência de negócios. Sendo cada vez mais adotado em vários setores, o data warehouse está mudando fundamentalmente a maneira como os negócios das empresas operam.