O que é desduplicação de dados?
A desduplicação de dados é uma técnica para compactar dados em que os dados duplicados são excluídos, mantendo uma cópia de cada unidade de informação em um sistema, em vez de permitir que os múltiplos prosperem. As cópias retidas têm referências que permitem que o sistema as recupere. Essa técnica reduz a necessidade de espaço de armazenamento e pode manter os sistemas funcionando mais rapidamente, além de limitar as despesas associadas ao armazenamento de dados. Ele pode funcionar de várias maneiras e é usado em muitos tipos de sistemas de computador. A desduplicação no nível do bloco analisa blocos de dados nos arquivos para identificar dados estranhos. As pessoas podem acabar com dados dobrados por uma ampla variedade de razões, e o uso da desduplicação de dados pode otimizar um sistema, facilitando o uso. O sistema pode periodicamente examinar os dados para verificar duplicatas, eliminar extras e gerar referências para os arquivos deixados para trás.
Como SysteÀs vezes, as MS são chamadas de sistemas de compressão inteligentes ou sistemas de armazenamento de instância única. Ambos os termos referenciam a ideia de que o sistema trabalha de forma inteligente para armazenar e arquivar dados para reduzir a carga no sistema. A desduplicação de dados pode ser especialmente valiosa com grandes sistemas em que dados de várias fontes são armazenados e os custos de armazenamento estão constantemente em ascensão, pois o sistema precisa ser expandido ao longo do tempo.
Esses sistemas são projetados para fazer parte de um sistema maior para compactar e gerenciar dados. A desduplicação de dados não pode proteger os sistemas de vírus e falhas, e é importante usar a proteção adequada do antivírus para manter um sistema seguro e limitar a contaminação viral de arquivos, além de fazer o backup em um local separado para abordar preocupações sobre a perda de dados devido a interrupções, danos ao equipamento e assim por diante. Ter os dados compactados antes de fazer o backup economizará tempoe dinheiro.
Os sistemas que utilizam a desduplicação de dados em seu armazenamento podem ser executados com mais rapidez e eficiência. Eles ainda exigirão expansão periódica para acomodar novos dados e abordar preocupações sobre a segurança, mas devem ser menos propensos a preencher rapidamente com dados duplicados. Essa é uma preocupação especialmente comum nos servidores de email, onde o servidor pode armazenar grandes quantidades de dados para usuários e pedaços significativos dele podem consistir em duplicatas como os mesmos anexos repetidos repetidamente; Por exemplo, muitas pessoas por e -mail do trabalho anexaram rodapés com isenções de responsabilidade de e -mail e logotipos da empresa, e eles podem consumir o espaço do servidor rapidamente.