Hvad er tabsfri datakomprimering?

Tabløs datakomprimering er en computermetode til lagring af filer og kombination af dem i arkiver, der tager mindre fysisk plads i hukommelsen end filerne ellers ville uden at miste oplysninger, dataene indeholder i processen. Tablig komprimering reducerer derimod filstørrelse med tilnærmelser af dataene, og restaurering er af en tæt fax til det originale filindhold. Algoritmer, der bruges til tabsfri datakomprimering, er i det væsentlige et sæt strømlinede regler eller instruktioner til kodning af oplysningerne ved hjælp af færre hukommelsesstykker, mens de stadig bevarer muligheden for at gendanne dataene til dets originale format uden ændring.

Nogle almindelige filtyper, der bruger tabsfri datakomprimering inkluderer de internationale forretningsgrupper (IBM) computerbaseret Zip og Unix-computerbaserede GZIP-file arkiver. Brugt er også billedfilformater såsom Graphic Interchange Format (GIF), Portable Network Graphics (PNG) og Bitmap (BMP) filer. Datakomprimeringsalgoritmer også vARY baseret på den filtype, der komprimeres, med almindelige variationer til tekst-, lyd- og eksekverbare programfiler.

De to hovedkategorier af algoritmer til tabsfri datakomprimering er baseret på en statistisk model for inputdata og en kortlægningsmodel af bitstrenge i en datafil. Rutinemæssige statistiske algoritmer, der anvendes, er Burrows-Wheeler Transform (BWT), Abraham Lempel og Jacob ZIV (LZ77) -algoritmen, der blev offentliggjort i 1977, og forudsigelsen med delvis matching (PPM) -metode. Kortlægningsalgoritmer, der ofte anvendes, inkluderer Huffman -kodningsalgoritmen og aritmetisk kodning.

Nogle af de tabsløse datakomprimeringsalgoritmer er open source -værktøjer, og andre er proprietære og patenterede, selvom patenter på nogle også nu er udløbet. Dette kan resultere i, at komprimeringsmetoder undertiden anvendes til det forkerte filformat. På grund af det faktum, at visse datakomprimeringsmetoder er uforenelige medMed hinanden kan lagring af blandede filer ofte forringe en komponent i en fil. For eksempel kan en billedfil med tekst, der er komprimeret, vise nedbrydning i læsbarheden af ​​teksten, når den først er gendannet. Scannere og software, der anvender grammatikinduktion, kan udtrække mening fra tekst, der er gemt sammen med billedfiler ved at anvende det, der er kendt som latent semantisk analyse (LSA).

En anden form for kortlægningsalgoritme -metode til tabsfri datakomprimering er brugen af ​​universel kode. Mere fleksibel at bruge end Huffman -kodning, det kræver ikke viden om maksimale heltalværdier forud for tiden. Huffman -kodning og aritmetisk kodning producerer dog bedre datakomprimeringshastigheder. Der er også en indsats for at producere universelle datakomprimeringsmetoder, der ville skabe algoritmer, der fungerer godt til forskellige kilder.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?