データ重複排除とは
データ重複排除とは、重複データを削除してデータを圧縮する手法であり、複数のデータを成功させるのではなく、システム上の各情報単位のコピーを1つ保持します。 保持されるコピーには、システムがそれらを取得できるようにする参照があります。 この手法により、ストレージスペースの必要性が減り、データストレージに関連する費用が制限されるだけでなく、システムの実行速度が向上します。 さまざまな方法で機能し、さまざまな種類のコンピューターシステムで使用されます。
ファイルレベルのデータ重複排除では、システムは重複ファイルを探し、余分なものを削除します。 ブロックレベルの重複排除では、ファイル内のデータのブロックを調べて、無関係なデータを識別します。 人々はさまざまな理由でデータが2倍になる可能性があり、データ重複排除を使用するとシステムが合理化され、使いやすくなります。 システムは定期的にデータを調べて重複をチェックし、余分なものを排除し、残されたファイルの参照を生成します。
このようなシステムは、インテリジェント圧縮システムまたはシングルインスタンスストレージシステムと呼ばれることもあります。 両方の用語は、システムの負荷を軽減するために、システムがデータを保存およびファイリングするためにインテリジェントに動作するという考えを参照しています。 データの重複排除は、多数のソースからのデータが保存され、システムを長期的に拡張する必要があるため、ストレージコストが常に増加している大規模なシステムで特に役立ちます。
これらのシステムは、データを圧縮および管理するためのより大きなシステムの一部として設計されています。 データの重複排除はシステムをウイルスや障害から保護することはできません。適切なウイルス対策保護を使用してシステムを安全に保ち、ファイルのウイルス汚染を制限すると同時に、停止、損傷によるデータ損失に関する懸念に対処するために別の場所にバックアップすることが重要です機器など。 バックアップする前にデータを圧縮すると、時間とお金を節約できます。
ストレージでデータ重複排除を利用するシステムは、より迅速かつ効率的に実行できます。 新しいデータに対応し、セキュリティに関する懸念に対処するために、定期的に拡張する必要がありますが、重複したデータですぐにいっぱいになる傾向が少ないはずです。 これは、サーバーがユーザーのために大量のデータを保存し、その重要な部分が同じ添付ファイルが繰り返し繰り返されるような重複で構成される可能性があるメールサーバーでは特に一般的な懸念事項です。 たとえば、職場からメールを送信する多くの人は、メールの免責事項と会社のロゴが付いたフッターを添付しているため、サーバースペースをすぐに使い果たしてしまいます。