ロスレスデータ圧縮とは何ですか?

ロスレスデータ圧縮は、ファイルを保存し、ファイルをメモリ内の物理的なスペースを占めるアーカイブに組み合わせるコンピューター方法であり、それ以外の場合は、プロセスにデータが含む情報を失うことなくファイルよりも少なくなります。対照的に、喪失した圧縮は、データの近似でファイルサイズを縮小し、復元は元のファイルの内容に近いものです。ロスレスデータ圧縮に使用されるアルゴリズムは、本質的に、メモリの少ないビットを使用して情報をエンコードするための合理化されたルールまたは指示のセットであり、変更なしでデータを元の形式に復元する機能を保持しています。 また、グラフィックインターチェンジ形式(GIF)、ポータブルネットワークグラフィックス(PNG)、ビットマップ(BMP)ファイルなどの画像ファイル形式も使用されます。データ圧縮アルゴリズムもvファイルタイプが圧縮されており、テキスト、オーディオ、実行可能なプログラムファイルの一般的なバリエーションがあることに基づいています。

ロスレスデータ圧縮のアルゴリズムの2つの主要なカテゴリは、入力データの統計モデルとデータファイル内のビット文字列のマッピングモデルに基づいています。使用されるルーチンの統計アルゴリズムは、1977年に公開されたバロウズホイーラー変換(BWT)、アブラハムレンペルおよびジェイコブZIV(LZ77)アルゴリズム、および部分的マッチング(PPM)メソッドによる予測です。頻繁に採用されるマッピングアルゴリズムには、Huffmanコーディングアルゴリズムと算術コーディングが含まれます。

ロスレスデータ圧縮アルゴリズムの一部はオープンソースツールであり、他のものは独自であり、特許が取れていますが、一部の特許も現在期限切れになっています。これにより、間違ったファイル形式に圧縮方法が適用される場合があります。特定のデータ圧縮方法が互換性がないという事実のために互いに、混合ファイルを保存すると、多くの場合、ファイルのコンポーネントを分解できます。たとえば、圧縮されたテキストを含む画像ファイルは、復元されたテキストの読みやすさに劣化を示すことができます。文法誘導を使用するスキャナーとソフトウェアは、潜在セマンティック分析(LSA)と呼ばれるものを適用することにより、画像ファイルとともに保存されたテキストから意味を抽出できます。

ロスレスデータ圧縮のためのマッピングアルゴリズムメソッドの別の形式は、ユニバーサルコードの使用です。 Huffmanコーディングよりも柔軟に使用できるため、最大の整数値の知識は事前に必要ありません。ただし、Huffmanのコーディングと算術コーディングは、より良いデータ圧縮率を生成します。また、さまざまなソースに適したアルゴリズムを作成する普遍的なデータ圧縮方法を作成する努力も進行中です。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?