Skip to main content

Che cos'è la compressione dei dati senza perdita?

La compressione dei dati senza perdita è un metodo del computer per archiviare i file e combinarli in archivi che occupano meno spazio fisico in memoria rispetto ai file altrimenti senza perdere informazioni che i dati contengono nel processo.La compressione di perdita, al contrario, riduce la dimensione del file con approssimazioni dei dati e il restauro è di un facsimile ravvicinato al contenuto del file originale.Gli algoritmi utilizzati per la compressione dei dati senza perdita sono essenzialmente una serie di regole o istruzioni semplificate per codificare le informazioni utilizzando meno bit di memoria pur mantenendo la capacità di ripristinare i dati nel suo formato originale senza alterazione.

Alcuni tipi di file comuni che utilizzano i dati senza perditaLa compressione include gli archivi di file GZIP per computer basati su computer basati su computer basati su computer e UNIX.Sono anche utilizzati formati di file di immagine come i file Graphic Interchange Format (GIF), Portable Network Graphics (PNG) e Bitmap (BMP).Gli algoritmi di compressione dei dati variano anche in base al tipo di file compresso, con variazioni comuni per i file di programma di testo, audio e eseguibili.

Le due principali categorie di algoritmi per la compressione dei dati senza perdita si basano su un modello statistico di dati di input e un modello di mappatura delle stringhe di bit in un file di dati.Gli algoritmi statistici di routine utilizzati sono la trasformata di Burrows-Wheeler (BWT), l'algoritmo di Abraham Lempel e Jacob Ziv (LZ77) pubblicato nel 1977 e la previsione del metodo di corrispondenza parziale (PPM).Gli algoritmi di mappatura frequentemente impiegati includono l'algoritmo di codifica Huffman e la codifica aritmetica.

Alcuni degli algoritmi di compressione dei dati senza perdita di dati sono strumenti open source e altri sono proprietari e brevettati, anche se alcuni brevetti su alcuni sono ora scaduti.Ciò può comportare i metodi di compressione a volte applicati al formato di file sbagliato.A causa del fatto che alcuni metodi di compressione dei dati sono incompatibili tra loro, l'archiviazione di file misti può spesso degradare un componente di un file.Ad esempio, un file di immagine con testo compresso può mostrare il degrado nella leggibilità del testo una volta ripristinato.Gli scanner e il software che impiegano l'induzione grammaticale possono estrarre significato dal testo memorizzato insieme ai file di immagini applicando ciò che è noto come Analisi semantica latente (LSA).

Un'altra forma di mappatura algoritmo per la compressione dei dati senza perdita è l'uso del codice universale.Più flessibile da usare rispetto alla codifica di Huffman, non richiede in anticipo la conoscenza dei valori interi massimi.La codifica di Huffman e la codifica aritmetica producono migliori tassi di compressione dei dati, tuttavia.Sono inoltre in corso sforzi per produrre metodi universali di compressione dei dati che creerebbero algoritmi che funzionano bene per una varietà di fonti.