¿Qué es la compresión de datos sin pérdidas?

La compresión de datos sin pérdidas es un método informático para almacenar archivos y combinarlos en archivos que ocupan menos espacio físico en la memoria de lo que los archivos lo harían sin perder ninguna información que los datos contengan en el proceso. La compresión con pérdida, por el contrario, reduce el tamaño del archivo con aproximaciones de los datos, y la restauración es de un facsímil cercano al contenido del archivo original. Los algoritmos utilizados para la compresión de datos sin pérdidas son esencialmente un conjunto de reglas o instrucciones simplificadas para codificar la información utilizando menos bits de memoria, al tiempo que mantienen la capacidad de restaurar los datos a su formato original sin alteración.

Algunos tipos de archivos comunes que utilizan la compresión de datos sin pérdidas incluyen las máquinas internacionales de negocios comerciales (IBM) basadas en el ZIP y unix archivos de archivos GZIP. También se utilizan formatos de archivo de imagen como el formato de intercambio gráfico (GIF), los gráficos de red portátiles (PNG) y los archivos de mapa de bits (BMP). Algoritmos de compresión de datos también VARY basado en el tipo de archivo que se comprime, con variaciones comunes para archivos de programa de texto, audio y ejecutables.

Las dos categorías principales de algoritmos para la compresión de datos sin pérdidas se basan en un modelo estadístico de datos de entrada y un modelo de mapeo de cadenas de bits en un archivo de datos. Los algoritmos estadísticos de rutina utilizados son el algoritmo Burrows-Wheeler (BWT), el Algoritmo de Abraham Lempel y Jacob Ziv (LZ77) publicado en 1977, y la predicción por método de coincidencia parcial (PPM). Los algoritmos de mapeo con frecuencia empleados incluyen el algoritmo de codificación de Huffman y la codificación aritmética.

Algunos de los algoritmos de compresión de datos sin pérdidas son herramientas de código abierto y otros son patentados y patentados, aunque las patentes en algunos también han expirado. Esto puede dar lugar a los métodos de compresión que a veces se aplican al formato de archivo incorrecto. Debido al hecho de que ciertos métodos de compresión de datos son incompatibles wI -Its, almacenar archivos mixtos a menudo puede degradar un componente de un archivo. Por ejemplo, un archivo de imagen con texto comprimido puede mostrar degradación en la legibilidad del texto una vez restaurado. Los escáneres y el software que emplean inducción de gramática pueden extraer significado del texto almacenado junto con archivos de imagen aplicando lo que se conoce como análisis semántico latente (LSA).

Otra forma de método de algoritmo de mapeo para la compresión de datos sin pérdidas es el uso de código universal. Más flexible para usar que la codificación de Huffman, no requiere conocimiento de los valores enteros máximos con anticipación. Sin embargo, la codificación de Huffman y la codificación aritmética producen mejores tasas de compresión de datos. También se están realizando esfuerzos para producir métodos de compresión de datos universales que crearían algoritmos que funcionen bien para una variedad de fuentes.

OTROS IDIOMAS