Wat is lossless gegevenscompressie?

Gegevenscompressie zonder verlies is een computermethode om bestanden op te slaan en te combineren in archieven die minder fysieke ruimte in het geheugen op zich nemen dan de bestanden anders zonder informatie te verliezen die de gegevens in het proces bevatten. Verliescompressie daarentegen vermindert de bestandsgrootte met benaderingen van de gegevens, en herstel is van een nauwe facsimile voor de oorspronkelijke bestandsinhoud. Algoritmen die worden gebruikt voor lossless gegevenscompressie zijn in wezen een set gestroomlijnde regels of instructies voor het coderen van de informatie met minder geheugen geheugen, terwijl de mogelijkheid is om de gegevens te herstellen om de gegevens te herstellen in het oorspronkelijke formaat zonder wijziging.

Sommige gemeenschappelijke bestandstypen die gebruik maken van verliesloze gegevenscompressie omvatten de internationale bedrijfsmachines (IBM) computergebaseerde zip- en UNIX-computer-archieven. Ook worden afbeeldingsbestandsformaten gebruikt, zoals het grafische uitwisselingsformaat (GIF), Portable Network Graphics (PNG) en bitmap (BMP) -bestanden. Gegevenscompressie -algoritmen ook vAry op basis van het bestandstype dat wordt gecomprimeerd, met veel voorkomende variaties voor tekst-, audio- en uitvoerbare programmabestanden.

De twee hoofdcategorieën van algoritmen voor verliesloze gegevenscompressie zijn gebaseerd op een statistisch model van invoergegevens en een kaartenmodel van bitreeksen in een gegevensbestand. De gebruikte routine statistische algoritmen zijn de Burrows-Wheeler Transform (BWT), de Abraham Lempel en Jacob Ziv (LZ77) algoritme gepubliceerd in 1977, en de voorspelling door Partial Matching (PPM) -methode. Mapping -algoritmen die vaak worden gebruikt, omvatten het Huffman -coderingsalgoritme en rekenkundige codering.

Sommige van de verliesloze gegevenscompressie -algoritmen zijn open source -tools en andere zijn gepatenteerd en gepatenteerd, hoewel patenten op sommige nu ook zijn verlopen. Dit kan ertoe leiden dat compressiemethoden soms worden toegepast op het verkeerde bestandsformaat. Vanwege het feit dat bepaalde gegevenscompressiemethoden onverenigbaar zijn WHet opslaan van gemengde bestanden kan een onderdeel van een bestand vaak afbreken. Een afbeeldingsbestand met tekst dat wordt gecomprimeerd kan bijvoorbeeld afbraak in de leesbaarheid van de tekst weergeven zodra ze eenmaal zijn hersteld. Scanners en software die gebruik maken van grammatica -inductie kan betekenis halen uit tekst die is opgeslagen samen met afbeeldingsbestanden door toe te passen wat bekend staat als latente semantische analyse (LSA).

Een andere vorm van mapping -algoritmemethode voor lossless datacompressie is het gebruik van universele code. Flexibeler om te gebruiken dan Huffman -codering, het vereist geen kennis van maximale gehele waarden van tevoren. Huffman -codering en rekenkundige codering produceren echter betere gegevenscompressiesnelheden. Er zijn ook inspanningen om universele datacompressiemethoden te produceren die algoritmen zouden creëren die goed werken voor verschillende bronnen.

ANDERE TALEN