容量最適化とは何ですか?
容量の最適化は、データを保存し、バックアップを作成する際のストレージの必要性を減らすためのさまざまな補完的な方法で構成されています。 多くの場合、企業および個々の企業は作業の複数のバックアップを作成し、データを保存、インデックス付け、および取得する必要があるため、すべてのデータを処理するために必要なハードウェアの量と結果のオーバーヘッドを削減するための最適化が必要です。 バックアップが作成されるとき、多くの場合、冗長性があり、バックアップ間でわずかな変更のみがあります。 冗長性を考慮して、容量最適化戦略は、ストレージコストを削減し、バックアップを元のサイズから最大95%削減したソリューションを考案します。 容量最適化は、ワイドエリアネットワーキング(WAN)アプリケーションで使用され、ネットワーク上でデータを送受信する際のスループットを向上させる帯域幅最適化として知られています。
データ圧縮では、通常、エンコード技術を使用して、保存または送信されるデータのサイズを削減します。 一部のデータがプロセスで破棄されるかどうかに応じて、損失のあるデータ(データの損失)または損失のないデータとして特徴付けられます。 データの冗長性または繰り返しをスキャンし、これらを相互参照されたインデックス付きトークンに置き換えることで、必要なストレージ容量を大幅に削減できます。 データ抑制コードブックは、通信のアクセラレータをガイドし、メモリまたはハードディスクのいずれかを同期して使用し、圧縮履歴をストレージリポジトリに書き込みます。これにより、伝送制御プロトコル(TCP)プロキシをパケットまたはセッションのバッファとして使用できるため、伝送速度は低下しません減少。 データ圧縮のもう1つの方法は、最初のバックアップを行うときにリアルタイムでデータのサイズを縮小し、さらに最適化することで、スペースと時間を大幅に節約します。
従来の圧縮手段を使用すると、保存データのサイズを2:1の比率で縮小できます。 容量の最適化を使用すると、この削減を最大20:1に増やすことができます。 比較ウィンドウ全体でバイトシーケンスの冗長性を探し、重複排除アルゴリズムの一意のシーケンスに暗号化ハッシュ関数を使用すると、データストリームをセグメント化できます。 これらのストリームセグメントには、一意の識別子が割り当てられ、取得のためにインデックスが付けられます。 これにより、圧縮標準アルゴリズムを使用してさらに圧縮される前に、新しいデータセットのみが保存されます。 一部の重複排除方法はハードウェアベースであり、従来のソフトウェア圧縮アルゴリズムと組み合わせることにより、両方の機能が大幅なスペースと時間の節約を実現できます。
多くのアプローチは、ストレージインフラストラクチャに関連するコストを削減するために、ストレージ容量のコストとスペースの削減に焦点を当てており、WANシナリオでも同様の考慮事項が発生します。 トランスポート層と呼ばれる層は、送信中にアプリケーションと基礎となるネットワーク構造の間に存在し、データを効率的かつ迅速に送受信できるようにする必要がありますが、トランスポート層はまだTCPが最初に作成され、300ボーで実行された1981年に作成されたものです割合。 したがって、アクセラレータはTCPプロキシを使用し、送信中の損失を減らし、確認応答を行って、高度なデータ圧縮方法を使用してパケットを増やし、時間セグメントごとにより多くのデータを配信します。 送信中の障害を克服するために、これらの技術はまとまって連携してアプリケーションのパフォーマンスを改善し、帯域幅の消費量を削減します。