Was ist ein Kompressionsalgorithmus?
Computerdateien können viel Speicherplatz auf der Festplatte sowie viel Bandbreite für die Übertragung beanspruchen. Um Platz zu sparen, insbesondere bei Dateien, auf die nur selten zugegriffen wird, und um die Bandbreite für die zu übertragenden Dateien zu erhöhen, wurden Speichermethoden entwickelt, mit denen die Daten in einem kleineren Paket gespeichert werden, indem sie auf irgendeine Weise komprimiert werden. In jedem Fall wird ein Komprimierungsalgorithmus - eine Methode zum Reduzieren der Datengröße - verwendet. Es gibt verschiedene gängige Kategorien und Typen von Komprimierungsalgorithmen, die jeweils auf unterschiedliche Weise funktionieren und deren Ergebnisse sich in wichtigen Punkten unterscheiden. Mit verschiedenen Komprimierungsalgorithmen ist es im Allgemeinen möglich, eine Textdatei auf weniger als die Hälfte ihrer ursprünglichen Größe zu verkleinern. Bei Grafikdateien variieren die Ergebnisse erheblich. Die aus der Komprimierung resultierende Datei kann entweder ein anderes Format haben oder eine Archivdatei, die häufig zum Speichern, Übertragen und Verteilen verwendet wird.
Eine Möglichkeit zur Kategorisierung von Komprimierungsalgorithmen besteht darin, Dictionary- oder statistische Methoden zum Komprimieren von Daten zu verwenden. Die Wörterbuchmethode konzentriert sich auf wiederholbare Phrasen und wird in GIF-Bildern sowie in JAR- und ZIP-Archiven verwendet. Die statistische Methode basiert auf der Verwendungshäufigkeit, um eine Umwandlung durchzuführen, die in zwei Durchgängen durchgeführt wird. Ein Beispiel ist Modified Huffman (mh), das in einigen Faxgeräten verwendet wird.
Eine zweite Möglichkeit, Komprimierungsalgorithmen zu kategorisieren, und die, auf die nicht professionelle Programmierer am häufigsten stoßen, besteht darin, ob sie verlustfrei oder verlustbehaftet sind. Bei einem verlustfreien Datenkomprimierungsalgorithmus werden die Daten so komprimiert, dass sie beim Dekomprimieren genau mit der Originaldatei identisch sind. Ein Beispiel für einen verlustfreien Datenkomprimierungsalgorithmus ist lzw (Lempel-Ziv-Welch-Algorithmus). Es wurde 1977 von Lempel und Ziv entwickelt und 1984 von Welch verbessert. Es wird in Dateien wie GIF, TIF und PDF sowie in bestimmten Modems verwendet.
Ein verlustbehafteter Datenkomprimierungsalgorithmus hat die Fähigkeit, Daten auf eine kleinere Größe als verlustfreie Komprimierung zu reduzieren, jedoch auf Kosten einiger Originaldaten. Mit anderen Worten ergibt die Wiederherstellung nach einer verlustbehafteten Datenkomprimierung keine identische Kopie der Originaldatei. Der Komprimierungsalgorithmus ist jedoch so konzipiert, dass die Verluste so begrenzt werden, dass sie weder für das Ohr noch für das Auge sichtbar sind. Verlustkomprimierung wird in Dateiformaten wie AAC, JPEG, MPEG und MP3 verwendet.