Wat is bestandscompressie?
Bestandscompressie is een methode die door computers wordt gebruikt om de grootte van een elektronisch bestand of een groep bestanden tot een zo klein mogelijke grootte te verkleinen. ZIP-bestanden zijn een veelvoorkomend voorbeeld van bestandscompressie. Er zijn veel technieken die computerprogramma's gebruiken om bestanden te comprimeren, maar de meest gebruikelijke methode is om herhaalde reeksen te vervangen door kleinere reeksen. Computers doen dit door de eerste instantie te catalogiseren en ernaar te verwijzen in volgende instanties. In de voorgaande zinnen zijn bijvoorbeeld de letters "comprimeren" drie keer verschenen. Een computer kan deze comprimeren door de eerste instantie te catalogiseren en alle volgende instanties te vergelijken met "& cmp" - waardoor het aantal letters of tekens wordt verminderd en de bestandsgrootte wordt verkleind. In de loop van een groot bestand kan een dergelijke vervanging veel ruimte besparen. Er moet echter worden opgemerkt dat de gebruiker dit niet ziet - de computer doet al het werk op de achtergrond.
Om de verkorte vervangingen bij te houden, maken computerprogramma's ook een woordenboek voor het gecomprimeerde bestand. In de wereld van bestandscompressie is een woordenboek een lijst met de originele zinnen en hun vervangingen. Dit woordenboek is echter opgenomen in de bestandsgrootte, dus het neemt ook ruimte in beslag, waardoor de hoeveelheid ruimte wordt bespaard die wordt bespaard door compressie. Om deze reden is het meestal minder efficiënt om een enkel klein bestand te comprimeren dan een groot bestand of groep.
Programma's die bestandscompressie uitvoeren, werken op enigszins verschillende manieren. Deze verschillen zijn meestal het gevolg van iets dat een algoritme wordt genoemd. Een algoritme is een wiskundige constructie die de bestanden doorzoekt op herhalingen en eenvoudige referenties invoert. Programmeurs maken de compressie-algoritmen en definiëren de patronen en vervangingen die voor compressie moeten worden gebruikt. De variaties kunnen de efficiëntie van de compressie beïnvloeden. Bijvoorbeeld, in de zin "het was de beste tijd, het was de slechtste tijd," worden de sequenties "het was de" en "de tijd" herhaald. Een programmeur kan ervoor kiezen om elke hele zin te vervangen of misschien "het" afzonderlijk en "van de tijd" afzonderlijk te vervangen. Dit kleine verschil in algoritmen is waarom sommige bestandscompressieprogramma's op sommige bestandstypen beter werken dan andere.
Sommige soorten gecomprimeerde bestanden zijn zelfuitpakkend, wat betekent dat ze automatisch worden geopend wanneer een gebruiker erop klikt. Er zijn geen externe programma's nodig om ze te decomprimeren. Om deze bestanden te maken, moet het originele compressieprogramma extra code aan het gecomprimeerde bestand toevoegen. Om deze reden is een zelfuitpakkend gecomprimeerd bestand vaak groter dan hetzelfde bestand als het normaal zou zijn gecomprimeerd. Dit wordt doorgaans beschouwd als een goede afweging voor bedrijven die programma's vrijgeven die op thuiscomputers kunnen worden geïnstalleerd. Door het bestand zelfuitpakkend te maken, kan de thuisgebruiker een stap overslaan en is de kans groter dat de software wordt geïnstalleerd. Om bestanden te decomprimeren die niet zelfuitpakken, zijn een aantal programma's van derden beschikbaar om te downloaden op internet.