ファイル圧縮とは
ファイル圧縮は、電子ファイルまたはファイルのグループのサイズを可能な限り最小のサイズに縮小するためにコンピューターで使用される方法です。 ZIPファイルは、ファイル圧縮の一般的な例です。 コンピュータプログラムがファイルを圧縮するために使用する多くの手法がありますが、最も一般的な方法は、繰り返されるシーケンスをより小さなシーケンスに置き換えることです。 コンピュータは、最初のインスタンスをカタログ化し、後続のインスタンスでそれを参照することでこれを行います。 たとえば、この前の文では、「圧縮」という文字が3回出現しています。 コンピューターは、最初のインスタンスをカタログ化し、後続のすべてのインスタンスを「&cmp」と同等にすることで、これらを圧縮する場合があります。つまり、必要な文字数が減り、ファイルサイズが小さくなります。 大きなファイルの場合、このような置換により、スペースを大幅に節約できます。 ただし、ユーザーにはこれが表示されないことに注意してください。コンピューターはすべての作業をバックグラウンドで実行します。
短縮された置換を追跡するために、コンピュータープログラムは圧縮ファイルの辞書も作成します。 ファイル圧縮の世界では、辞書は元のフレーズとその置換のリストです。 ただし、この辞書はファイルサイズに含まれているため、スペースを占有し、圧縮によって節約されるスペースの量を削減します。 このため、通常、単一の小さなファイルを圧縮するほうが、大きなファイルまたはグループよりも効率が低くなります。
ファイル圧縮を実行するプログラムは、わずかに異なる方法で動作します。 これらの違いは、主にアルゴリズムと呼ばれるものの結果です。 アルゴリズムは、ファイルの繰り返しを検索し、単純な参照を入れる数学的構造です。 プログラマは、圧縮アルゴリズムを作成し、圧縮に使用されるパターンと置換を定義します。 分散は、圧縮の効率に影響を与える可能性があります。 たとえば、「それは最高の時間であり、それは最悪の時間でした」というフレーズでは、「それは」であり、「stの時間」のシーケンスが繰り返されます。 プログラマーは、フレーズ全体を置換するか、「it」を個別に、または「of」を個別に置換することを選択できます。 アルゴリズムのこれらのわずかな違いは、一部のファイル圧縮プログラムが他のファイルタイプよりも優れている理由です。
一部のタイプの圧縮ファイルは自己解凍型です。つまり、ユーザーがクリックすると自動的に開きます。圧縮解除に外部プログラムは必要ありません。 これらのファイルを作成するには、元の圧縮プログラムが圧縮ファイルにコードを追加する必要があります。 このため、通常の方法で圧縮された場合、自己解凍型の圧縮ファイルは同じファイルよりも大きくなることがよくあります。 これは通常、家庭用コンピューターにインストールするプログラムをリリースする企業にとっては良いトレードオフと考えられています。 ファイルを自己解凍形式にすることにより、ホームユーザーが手順をスキップして、ソフトウェアがインストールされる可能性を高めることができます。 自己解凍型ではないファイルを圧縮解除するために、インターネットから多数のサードパーティプログラムをダウンロードできます。