Was ist Deduplizierung?

Deduplizierung ist ein Prozess, mit dem redundante Daten entfernt werden. Während des Vorgangs wird die Festplatte eines Computers über Vergleichsfenster nach großen Datensequenzen durchsucht. Beim Scannen nach doppelten Daten werden normalerweise Sequenzen von acht Kilobyte oder mehr herausgegriffen. Wenn die Sequenz an einer anderen Stelle im Speichersystem gefunden wird, wird auf die duplizierte Datei verwiesen und nicht erneut gespeichert.

Eine erfolgreiche Deduplizierung kann mehrere Kilobyte Daten auf einem Computer eliminieren, was zu offensichtlichen Vorteilen führt. Das Duplizieren von Daten nimmt unnötig Platz im System ein. Wenn externe Daten entfernt werden, bleibt dem Benutzer mehr Speicherplatz auf dem Computer. Auf diese Weise kann das System schneller und effizienter ausgeführt werden, da es nicht mit den zusätzlichen Daten überfrachtet ist. Darüber hinaus macht sich die Bandbreitenverbesserung immer dann bemerkbar, wenn ein Computer über mehr freien Speicherplatz verfügt.

Bei der Deduplizierung wird auf die große Datenmenge am ersten Speicherort verwiesen und die zusätzlichen Kopien der Daten gelöscht, die jedoch indiziert werden, falls sie benötigt werden. Häufig können dieselben genauen Daten an bis zu 100 verschiedenen Stellen auf einer Festplatte gespeichert werden. Wenn jedes ein Megabyte Speicherplatz belegt, reduziert die Deduplizierung diesen Speicherplatz auf der Festplatte von 100 Megabyte auf nur ein einziges. Der Prozess funktioniert durch Archivierung der Daten, und der zusätzliche Speicherplatz, der gewonnen wird, ist sehr vorteilhaft für die Festplatte eines Computers.

Zu den weiteren Vorteilen der Deduplizierung gehört die Reduzierung des erforderlichen Sicherungsspeichers um bis zu 90 Prozent, die Reduzierung von Kosten wie Strom-, Platz- und Kühlungsanforderungen, die Wiederherstellung eines höheren Servicelevels, die Beseitigung vieler verschiedener Fehlerarten und die Wiederherstellung von Daten bei mehreren verschiedene Punkte. Ein Nachteil der Deduplizierung besteht darin, dass die doppelten Daten mithilfe von kryptografischen Hash-Funktionen identifiziert werden, die möglicherweise unzuverlässig sind, und dass eine Kollision oder ein anderer Fehlertyp zu Datenverlust führen würde. Wenn der Person, die das Verfahren autorisiert hat, die Redundanzreduzierung nicht bekannt ist, kann die Zuverlässigkeit des Computers beeinträchtigt werden.

Bei der Datendeduplizierung werden zunächst alle verarbeiteten Daten segmentiert. Jedes Segment wird identifiziert und mit Daten verglichen, die sich bereits im System befinden. Wenn die Daten eindeutig sind, werden sie auf einer Festplatte gespeichert. Wenn es sich um ein doppeltes Datenelement handelt, wird stattdessen eine Referenz erstellt. Die Deduplizierung kann mithilfe der als Data Domain bezeichneten Software implementiert werden, die mit Daten- und Speichersystemen zusammenarbeitet, um Daten zu filtern und die einzelnen Bytes nach Bedarf zu referenzieren, zu entfernen oder zu speichern.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?