Was ist Datendeduplizierung?
Die Datendeduplizierung ist eine Technik zum Komprimieren von Daten, bei der doppelte Daten gelöscht werden. Dabei wird eine Kopie jeder Informationseinheit in einem System beibehalten, anstatt dass mehrere Daten gedeihen. Die aufbewahrten Kopien haben Verweise, mit denen das System sie abrufen kann. Diese Technik reduziert den Speicherplatzbedarf und kann den Betrieb von Systemen beschleunigen und die mit der Datenspeicherung verbundenen Kosten begrenzen. Es kann auf verschiedene Arten funktionieren und wird auf vielen Arten von Computersystemen verwendet.
Bei der Datendeduplizierung auf Dateiebene sucht das System nach doppelten Dateien und löscht die Extras. Bei der Deduplizierung auf Blockebene werden Datenblöcke in Dateien untersucht, um nicht relevante Daten zu identifizieren. Menschen können aus einer Vielzahl von Gründen doppelte Daten erhalten, und die Verwendung der Datendeduplizierung kann ein System rationalisieren und die Verwendung vereinfachen. Das System kann die Daten regelmäßig durchsuchen, um nach Duplikaten zu suchen, Extras zu eliminieren und Referenzen für die zurückgelassenen Dateien zu generieren.
Solche Systeme werden manchmal als intelligente Kompressionssysteme oder Einzelinstanz-Speichersysteme bezeichnet. Beide Begriffe beziehen sich auf die Idee, dass das System intelligent arbeitet, um Daten zu speichern und abzulegen, um die Belastung des Systems zu verringern. Die Datendeduplizierung kann besonders bei großen Systemen von Nutzen sein, bei denen Daten aus einer Reihe von Quellen gespeichert werden und die Speicherkosten ständig steigen, da das System im Laufe der Zeit erweitert werden muss.
Diese Systeme sollen Teil eines größeren Systems zum Komprimieren und Verwalten von Daten sein. Die Datendeduplizierung kann Systeme nicht vor Viren und Fehlern schützen. Es ist wichtig, einen angemessenen Virenschutz zu verwenden, um die Sicherheit eines Systems zu gewährleisten und die Viruskontamination von Dateien zu begrenzen. Gleichzeitig wird eine Sicherungskopie an einem separaten Speicherort erstellt, um Bedenken hinsichtlich Datenverlust aufgrund von Ausfällen und Beschädigungen von zu beseitigen Ausrüstung und so weiter. Wenn Sie die Daten vor dem Sichern komprimieren, sparen Sie Zeit und Geld.
Systeme, die Datendeduplizierung in ihrem Speicher verwenden, können schneller und effizienter ausgeführt werden. Sie müssen weiterhin regelmäßig erweitert werden, um neue Daten aufzunehmen und Sicherheitsbedenken auszuräumen, sollten jedoch weniger dazu neigen, sich schnell mit doppelten Daten zu füllen. Dies ist ein besonders häufiges Problem bei E-Mail-Servern, bei denen der Server möglicherweise große Datenmengen für Benutzer speichert und erhebliche Teile davon aus Duplikaten bestehen können, z. Beispielsweise haben viele Leute, die von der Arbeit aus E-Mails senden, angehängte Fußzeilen mit E-Mail-Haftungsausschlüssen und Firmenlogos, die den Serverplatz schnell aufbrauchen können.