Hva er tapsfri datakomprimering?
Lossfri datakomprimering er en datamaskinmetode for lagring av filer og kombinere dem til arkiver som tar opp mindre fysisk rom i minnet enn filene ellers ville uten å miste informasjon dataene inneholder i prosessen. Tapende komprimering reduserer derimot filstørrelse med tilnærminger av dataene, og restaurering er av en nær faksimile til det opprinnelige filinnholdet. Algoritmer som brukes til tapsfri datakomprimering er i hovedsak et sett med strømlinjeformede regler eller instruksjoner for å kode informasjonen ved hjelp av færre minnebiter, mens du fremdeles beholder muligheten til å gjenopprette dataene til det opprinnelige formatet uten endring.
Noen vanlige filtyper som bruker tapsfri datakomprimering inkluderer den internasjonale forretningsmaskinen (IBM) datamaskinbasert ZIP og UNIX. Brukte bildefilformater som Graphic Interchange Format (GIF), Portable Network Graphics (PNG) og Bitmap (BMP) -filer. Datakomprimeringsalgoritmer også vARY basert på at filtypen blir komprimert, med vanlige variasjoner for tekst-, lyd- og kjørbare programfiler.
De to hovedkategoriene av algoritmer for tapsfri datakomprimering er basert på en statistisk modell av inngangsdata og en kartleggingsmodell av bitstrenger i en datafil. Rutinemessige statistiske algoritmer som brukes er Burrows-Wheeler Transform (BWT), Abraham Lempel og Jacob ZIV (LZ77) algoritmen publisert i 1977, og prediksjonen ved delvis matching (PPM) metode. Kartleggingsalgoritmer som ofte brukes inkluderer Huffman -kodingsalgoritmen og aritmetisk koding.
Noen av de tapsfrie datakomprimeringsalgoritmene er open source -verktøy og andre er proprietære og patenterte, selv om patenter på noen nå også har utløpt. Dette kan føre til at komprimeringsmetoder noen ganger blir brukt på feil filformat. På grunn av det faktum at visse datakomprimeringsmetoder er inkompatible wMed hverandre kan lagring av blandede filer ofte nedbryte en komponent i en fil. For eksempel kan en bildefil med tekst som er komprimert vise nedbrytning i lesbarheten til teksten når den er gjenopprettet. Skannere og programvare som bruker grammatikkinduksjon kan trekke ut betydning fra tekst lagret sammen med bildefiler ved å bruke det som er kjent som latent semantisk analyse (LSA).
En annen form for kartleggingsalgoritmemetode for tapsfri datakomprimering er bruken av universell kode. Mer fleksibel å bruke enn Huffman -koding, det krever ikke kunnskap om maksimale heltallverdier på forhånd. Huffman -koding og aritmetisk koding gir imidlertid bedre datakomprimeringshastigheter. Det pågår også innsats for å produsere universelle datakomprimeringsmetoder som vil skape algoritmer som fungerer bra for en rekke kilder.