Skip to main content

Τι είναι η συμπίεση δεδομένων χωρίς απώλειες;

Η συμπίεση δεδομένων χωρίς απώλειες είναι μια μέθοδος υπολογιστή για την αποθήκευση αρχείων και το συνδυασμό τους σε αρχεία που καταλαμβάνουν λιγότερο φυσικό χώρο στη μνήμη από ό, τι τα αρχεία διαφορετικά χωρίς να χάσουν οποιαδήποτε πληροφορία τα δεδομένα περιέχουν στη διαδικασία.Η συμπίεση Lossy, αντίθετα, μειώνει το μέγεθος του αρχείου με τις προσεγγίσεις των δεδομένων και η αποκατάσταση είναι στενής τηλεομοιοτυπίας με το αρχικό περιεχόμενο του αρχείου.Οι αλγόριθμοι που χρησιμοποιούνται για τη συμπίεση δεδομένων χωρίς απώλειες είναι ουσιαστικά ένα σύνολο εξορθολογισμένων κανόνων ή οδηγιών για την κωδικοποίηση των πληροφοριών χρησιμοποιώντας λιγότερα κομμάτια μνήμης, διατηρώντας παράλληλα τη δυνατότητα αποκατάστασης των δεδομένων στην αρχική του μορφή χωρίς αλλοίωση.Η συμπίεση περιλαμβάνει τα διεθνή επιχειρηματικά μηχανήματα (IBM) με φερμουάρ και το UNIX Computer GZIP αρχείων αρχείων.Χρησιμοποιούνται επίσης μορφές αρχείων εικόνας, όπως η μορφή γραφικών ανταλλαγής (GIF), τα αρχεία Portable Network Graphics (PNG) και Bitmap (BMP).Οι αλγόριθμοι συμπίεσης δεδομένων ποικίλλουν επίσης με βάση τον τύπο αρχείου που συμπιέζεται, με κοινές παραλλαγές για αρχεία κειμένου, ήχου και εκτελέσιμων προγραμμάτων.

Οι δύο κύριες κατηγορίες αλγορίθμων για τη συμπίεση δεδομένων χωρίς απώλειες βασίζονται σε ένα στατιστικό μοντέλο δεδομένων εισόδου και ένα μοντέλο χαρτογράφησης των συμβολοσειρών δυαδικών ψηφίων σε ένα αρχείο δεδομένων.Οι συνήθεις στατιστικοί αλγόριθμοι που χρησιμοποιούνται είναι ο αλγόριθμος του Burrows-Wheeler (BWT), ο αλγόριθμος Abraham Lempel και Jacob ZIV (LZ77) που δημοσιεύθηκε το 1977 και η μέθοδος πρόβλεψης με μερική αντιστοίχιση (PPM).Οι αλγόριθμοι χαρτογράφησης που χρησιμοποιούνται συχνά περιλαμβάνουν τον αλγόριθμο κωδικοποίησης Huffman και την αριθμητική κωδικοποίηση. Μερικοί από τους αλγόριθμους συμπίεσης δεδομένων χωρίς απώλειες είναι εργαλεία ανοιχτού κώδικα και άλλα είναι ιδιόκτητα και κατοχυρωμένα με δίπλωμα ευρεσιτεχνίας, αν και έχουν επίσης λήξει τα διπλώματα ευρεσιτεχνίας σε ορισμένους.Αυτό μπορεί να οδηγήσει σε μεθόδους συμπίεσης μερικές φορές να εφαρμόζονται σε μια λανθασμένη μορφή αρχείου.Λόγω του γεγονότος ότι ορισμένες μέθοδοι συμπίεσης δεδομένων είναι ασυμβίβαστες μεταξύ τους, η αποθήκευση μικτών αρχείων μπορεί συχνά να υποβαθμίσει ένα στοιχείο ενός αρχείου.Για παράδειγμα, ένα αρχείο εικόνας με κείμενο που συμπιέζεται μπορεί να παρουσιάσει υποβάθμιση στην αναγνωσιμότητα του κειμένου μόλις αποκατασταθεί.Οι σαρωτές και το λογισμικό που χρησιμοποιούν την επαγωγή γραμματικής μπορούν να εξάγουν νόημα από το κείμενο που είναι αποθηκευμένο μαζί με αρχεία εικόνας εφαρμόζοντας αυτό που είναι γνωστό ως λανθάνουσα σημασιολογική ανάλυση (LSA).Πιο ευέλικτο για χρήση από την κωδικοποίηση Huffman, δεν απαιτεί γνώση των μέγιστων ακέραιων τιμών μπροστά από το χρόνο.Ωστόσο, η κωδικοποίηση Huffman και η αριθμητική κωδικοποίηση παράγουν καλύτερους ρυθμούς συμπίεσης δεδομένων.Καταβάλλονται επίσης προσπάθειες για την παραγωγή μεθόδων παγκόσμιας συμπίεσης δεδομένων που θα δημιουργούσαν αλγόριθμους που λειτουργούν καλά για διάφορες πηγές.