O que é desduplicação?

A desduplicação é um processo usado para eliminar dados redundantes. Durante o processo, o disco rígido de um computador é digitalizado para grandes sequências de dados nas janelas de comparação. Enquanto a digitalização quanto a dados duplicados, sequências de oito kilobytes ou mais são normalmente escolhidas. Se a sequência for encontrada em outras partes do sistema de armazenamento, o arquivo duplicado será referenciado em vez de armazenado novamente. A duplicação de dados ocupa sala desnecessária no sistema e, quando dados estranhos são removidos, isso deixa o usuário com mais espaço de armazenamento no computador. Isso permitirá que o sistema seja executado mais rápido e com mais eficiência, porque não está atolado com os dados extras. Além disso, a melhoria da largura de banda é sempre mais perceptível quando um computador tem mais espaço livre.Os dados, que são, no entanto, indexados caso sejam necessários. Muitas vezes, os mesmos dados exatos podem ser armazenados em até 100 locais diferentes em um disco rígido. Se cada um ocupar um megabyte de espaço, a desduplicação reduzirá esse espaço no disco rígido de 100 megabytes para apenas um. O processo funciona arquivando os dados e o espaço adicional que é obtido é muito benéfico para o disco rígido de um computador.

Benefícios adicionais da desduplicação incluem reduzir a quantidade de espaço de backup necessário em até 90 %, reduzindo custos como energia, espaço e requisitos de refrigeração, restaurando um nível mais alto de serviço, eliminando muitos tipos diferentes de erros e recuperando dados em vários pontos diferentes. Uma desvantagem da desduplicação é que ele identifica os dados duplicados usando funções de hash criptográfico, que podem não ser confiáveis, e uma colisão ou outro tipo de erro reriveriaLT na perda de dados. Além disso, se a pessoa que autorizou o procedimento não estiver ciente da redução de redundância envolvida, a confiabilidade do computador pode ser afetada adversamente.

A desduplicação de dados funciona primeiro segmentando cada peça de dados que é processada. Cada segmento é identificado e comparado aos dados que já estão no sistema. Se os dados forem exclusivos, serão armazenados em um disco. Se for uma peça de dados duplicada, é criada uma referência. A desduplicação pode ser implementada usando o software chamado Data Domain, que funciona com sistemas de dados e armazenamento para filtrar através de dados, referência, eliminando ou armazenando cada byte, conforme apropriado.

O que é desduplicação?

OUTRAS LÍNGUAS

ARTIGOS RELACIONADOS

Como podemos ajudar?