重複排除とは何ですか？

重複排除は、冗長データを排除するために使用されるプロセスです。プロセス中に、コンピューターのハードドライブが、比較ウィンドウ全体で大きなデータシーケンスを使用するためにスキャンされます。複製データをスキャンしている間、8つ以上のキロバイト以上のシーケンスが通常選ばれます。シーケンスがストレージシステムの他の場所で見つかった場合、重複したファイルが再び保存されるのではなく参照されます。データの複製は、システム内の不必要な部屋を占め、外部のデータが削除されると、ユーザーはコンピューター上のストレージスペースを増やします。これにより、システムは追加のデータに迷い込まれていないため、より速く、より効率的に実行できます。さらに、コンピューターがより多くの空き容量を持っている場合、帯域幅の改善は常により顕著です。ただし、彼のデータは、必要な場合に備えてインデックスが付けられています。多くの場合、同じデータをハードドライブに100個もの異なる場所に保存できます。それぞれが1メガバイトのスペースを占有する場合、重複排除により、ハードドライブのこのスペースが100メガバイトから1つだけに減少します。このプロセスはデータをアーカイブすることで機能し、獲得される追加スペースはコンピューターのハードドライブにとって非常に有益です。

重複排除の追加の利点には、必要なバックアップスペースの量を最大90％削減すること、電力、スペース、冷却要件などのコストの削減、より高いレベルのサービスの回復、さまざまな種類のエラーの排除、いくつかの異なるポイントでのデータの回復などがあります。重複排除の欠点は、暗号化ハッシュ関数を使用して重複データを識別することです。データの損失のLT。また、手順を承認した人が冗長性の削減を認識していない場合、コンピューターの信頼性が悪影響を受ける可能性があります。

データの重複排除は、最初に処理された各データをセグメント化することで機能します。各セグメントが識別され、すでにシステムにあるデータと比較されます。データが一意の場合、ディスクに保存されます。重複したデータの場合、代わりに参照が作成されます。重複排除は、データとストレージシステムを使用してデータをフィルタリングし、各バイトを参照、排除、または保存するデータを使用して、データドメインと呼ばれるソフトウェアを使用して実装できます。

重複排除とは何ですか？

他の言語

関連記事

どのように我々は助けることができます？