O que é gerenciamento de armazenamento hierárquico?
O gerenciamento hierárquico de armazenamento (HSM) fornece um meio para as organizações organizarem o armazenamento e a recuperação de dados em camadas separadas para gerenciamento de custos e eficiência do espaço de armazenamento. A técnica também é chamada ocasionalmente de armazenamento em camadas. Funciona como um cache, mas em uma escala muito maior, onde os dados usados com freqüência são armazenados em unidades de disco mais rápidas na frente e arquivados em mídia mais lenta nas camadas mais baixas. Como certos arquivos são usados com mais frequência, eles residem na primeira camada e são movidos para as camadas inferiores à medida que ficam fora de uso.
A espinha dorsal do gerenciamento de armazenamento hierárquico é o software. É necessária uma lógica muito detalhada para catalogar os dados e observar os arquivos usados com frequência que devem residir na camada superior. O software também é responsável por gerenciar os pedidos na camada da biblioteca e garantir que esses pedidos ocorram de maneira um tanto oportuna.
Há vários recursos diferentes para as várias implementações de software de gerenciamento de armazenamento hierárquico disponíveis. Alguns softwares podem permitir uma camada de backup, na qual todos os dados, independentemente de serem acessados com frequência ou arquivados, também são enviados para outras mídias de armazenamento de longo prazo. Outros recursos podem incluir integração com sistemas de computador que usam o HSM. Aqui, os dados são extraídos de outros servidores ou estações de trabalho na rede para o HSM primário e organizados ainda mais na camada de disco ou armazenamento ou em um backup completo.
As implementações hierárquicas de gerenciamento de armazenamento também podem variar de acordo com o caso de uso. Em algumas situações, uma parte de um arquivo grande fica em um disco de alta velocidade e é vinculada ao restante do arquivo na mídia de armazenamento. Quando uma solicitação do usuário chega, a primeira parte do arquivo é lida do disco, enquanto o restante é recuperado da mídia de armazenamento. Essa técnica é frequentemente usada em implementações de streaming de mídia grandes, como vídeo na Internet.
Existem também algumas desvantagens no gerenciamento de armazenamento hierárquico. O mais notável é o tempo necessário para recuperar dados usados com menos frequência da camada de armazenamento. No caso de muitos arquivos pequenos, por exemplo, pode levar mais de horas ou até dias para a robótica reunir a solicitação, que pode se espalhar por vários discos na jukebox. Nesses casos, os administradores de sistemas geralmente recomendam que o usuário agrupe grandes quantidades de arquivos menores em arquivos de formato de arquivo único. A camada de armazenamento precisa apenas procurar um único arquivo, normalmente armazenado em uma única mídia na biblioteca.