Cos'è la deduplicazione dei dati?
La deduplicazione dei dati è una tecnica per comprimere i dati in cui vengono eliminati i dati duplicati, mantenendo una copia di ciascuna unità di informazioni su un sistema piuttosto che consentire a multipli di prosperare. Le copie trattenute hanno riferimenti che consentono al sistema di recuperarle. Questa tecnica riduce la necessità di spazio di archiviazione e può far funzionare i sistemi più velocemente oltre a limitare le spese associate all'archiviazione dei dati. Può funzionare in vari modi ed è utilizzato su molti tipi di sistemi informatici.
Nella deduplicazione dei dati a livello di file, il sistema cerca file duplicati ed elimina gli extra. La deduplicazione a livello di blocco esamina blocchi di dati all'interno di file per identificare i dati estranei. Le persone possono finire con dati raddoppiati per un'ampia varietà di motivi e l'utilizzo della deduplicazione dei dati può semplificare un sistema, rendendo più facile l'uso. Il sistema può periodicamente meschino attraverso i dati per verificare i duplicati, eliminare gli extra e generare riferimenti per i file lasciati alle spalle.
Tale sistemaLe MS sono talvolta indicate come sistemi di compressione intelligenti o sistemi di archiviazione a istanza singola. Entrambi i termini fanno riferimento all'idea che il sistema funzioni in modo intelligente per archiviare e file per ridurre il carico sul sistema. La deduplicazione dei dati può essere particolarmente preziosa con sistemi di grandi dimensioni in cui vengono archiviati i dati provenienti da una serie di fonti e i costi di archiviazione sono costantemente in aumento, poiché il sistema deve essere ampliato nel tempo.
Questi sistemi sono progettati per far parte di un sistema più ampio per la compressione e la gestione dei dati. La deduplicazione dei dati non è in grado di proteggere i sistemi da virus e guasti ed è importante utilizzare un'adeguata protezione antivirus per mantenere un sistema sicuro e limitare la contaminazione virale dei file mentre si esegue anche il backup in una posizione separata per affrontare le preoccupazioni sulla perdita di dati dovuta a interruzioni, danni alle attrezzature e così via. Avere i dati compressi prima del backup risparmierà tempoe denaro.
I sistemi che utilizzano la deduplicazione dei dati nella loro memoria possono funzionare in modo più rapido ed efficiente. Richiederanno comunque un'espansione periodica per accogliere nuovi dati e per affrontare le preoccupazioni sulla sicurezza, ma dovrebbero essere meno inclini a riempire rapidamente dati duplicati. Questa è una preoccupazione particolarmente comune sui server di posta elettronica, in cui il server può archiviare grandi quantità di dati per gli utenti e blocchi significativi potrebbero consistere in duplicati come gli stessi allegati ripetuti più e più volte; Ad esempio, molte persone che inviano un'e -mail dal lavoro hanno allegato piè di pagina con disclaimer e -mail e loghi dell'azienda, e queste possono consumare rapidamente lo spazio del server.