¿Qué es la deduplicación de datos?
La deduplicación de datos es una técnica para comprimir datos donde se eliminan los datos duplicados, manteniendo una copia de cada unidad de información en un sistema en lugar de permitir que los múltiplos prosperen. Las copias retenidas tienen referencias que permiten que el sistema las recupere. Esta técnica reduce la necesidad de espacio de almacenamiento y puede mantener los sistemas que funcionan más rápido, además de limitar los gastos asociados con el almacenamiento de datos. Puede funcionar de varias maneras y se usa en muchos tipos de sistemas informáticos.
En la deduplicación de datos a nivel de archivo, el sistema busca cualquier archivo duplicado y elimina los extras. La deduplicación a nivel de bloque analiza los bloques de datos dentro de los archivos para identificar datos extraños. Las personas pueden terminar con datos dobles por una amplia variedad de razones, y el uso de la deduplicación de datos puede agilizar un sistema, lo que facilita el uso. El sistema puede portar periódicamente a través de los datos para verificar los duplicados, eliminar extras y generar referencias para los archivos que quedan.Los MS a veces se conocen como sistemas de compresión inteligente, o sistemas de almacenamiento de una sola instancia. Ambos términos hacen referencia a la idea de que el sistema funciona de manera inteligente para almacenar y presentar datos para reducir la carga en el sistema. La deduplicación de datos puede ser especialmente valiosa con grandes sistemas donde los datos de varias fuentes se almacenan y los costos de almacenamiento están constantemente en aumento, ya que el sistema debe ampliarse con el tiempo.
Estos sistemas están diseñados para formar parte de un sistema más grande para comprimir y administrar datos. La deduplicación de datos no puede proteger los sistemas de virus y fallas, y es importante utilizar la protección antivirus adecuada para mantener un sistema seguro y limitar la contaminación viral de los archivos, al mismo tiempo que se respalda en una ubicación separada para abordar las preocupaciones sobre la pérdida de datos debido a las interrupciones, el daño a los equipos, etc. Tener los datos comprimidos antes de hacer una copia de seguridad ahorrará tiempoy dinero.
Los sistemas que utilizan la deduplicación de datos en su almacenamiento pueden ejecutarse de manera más rápida y eficiente. Todavía requerirán una expansión periódica para acomodar nuevos datos y abordar las preocupaciones sobre la seguridad, pero deberían ser menos propensos a llenarse rápidamente con datos duplicados. Esta es una preocupación especialmente común en los servidores de correo electrónico, donde el servidor puede almacenar grandes cantidades de datos para los usuarios y los fragmentos significativos de él podrían consistir en duplicados como los mismos archivos adjuntos repetidos una y otra vez; Por ejemplo, muchas personas enviando correos electrónicos del trabajo han adjuntado los pies con descargos por correo electrónico y logotipos de la compañía, y estos pueden comer espacio de servidor rápidamente.