Hva er tapfri datakomprimering?

Tapfri datakomprimering er en datamaskinmetode for å lagre filer og kombinere dem i arkiver som tar mindre fysisk plass i minnet enn filene ellers ville gjort uten å miste informasjonen dataene inneholder i prosessen. Tapskomprimering reduserer derimot filstørrelsen med tilnærminger til dataene, og restaurering er en nær faksimil til det originale filinnholdet. Algoritmer som brukes for tapsfri datakomprimering er i hovedsak et sett med strømlinjeformede regler eller instruksjoner for å kode informasjonen ved å bruke færre minnebiter, mens du fortsatt beholder muligheten til å gjenopprette dataene til det opprinnelige formatet uten endring.

Noen vanlige filtyper som bruker tapsfri datakomprimering, inkluderer International Business Machines (IBM) datamaskinbaserte zip og Unix datamaskinbaserte gzip-filarkiver. Bildeformater som grafisk utvekslingsformat (GIF), bærbar nettverksgrafikk (PNG) og Bitmap (BMP) brukes også. Datakomprimeringsalgoritmer varierer også basert på filtypen som komprimeres, med vanlige varianter for tekst-, lyd- og kjørbare programfiler.

De to hovedkategoriene av algoritmer for tapsfri datakomprimering er basert på en statistisk modell av inndatadata og en kartleggingsmodell av bitstrenger i en datafil. Rutinemessige statistiske algoritmer som brukes er Burrows-Wheeler transform (BWT), Abraham Lempel og Jacob Ziv (LZ77) algoritmen utgitt i 1977, og Prediction by Partial Matching (PPM) metoden. Kartleggingsalgoritmer som ofte brukes inkluderer Huffman-kodingsalgoritmen og aritmetisk koding.

Noen av de tapsfrie datakomprimeringsalgoritmene er åpen kildekodeverktøy, og andre er proprietære og patenterte, selv om patenter på noen nå også er utløpt. Dette kan føre til at komprimeringsmetoder noen ganger blir brukt på feil filformat. På grunn av det faktum at visse datakomprimeringsmetoder er inkompatible med hverandre, kan lagring av blandede filer ofte ødelegge en komponent av en fil. En bildefil med tekst som er komprimert kan for eksempel vise degradering i tekstens lesbarhet når den er gjenopprettet. Skannere og programvare som bruker grammatikkinduksjon, kan trekke ut mening fra tekst som er lagret sammen med bildefiler ved å bruke det som er kjent som latent semantisk analyse (LSA).

En annen form for kartleggingsalgoritmemetode for tapsfri datakomprimering er bruk av universell kode. Mer fleksibel å bruke enn Huffman-koding, det krever ikke kunnskap om maksimale heltallverdier på forhånd. Huffman-koding og aritmetisk koding gir imidlertid bedre datakomprimeringsrater. Det arbeides også med å produsere universelle datakomprimeringsmetoder som vil skape algoritmer som fungerer godt for en rekke kilder.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?