Co to jest kompresja mowy?
Kompresja mowy obejmuje kompresję danych audio w formie mowy. Mowa jest dość unikalną formą danych audio, z szeregiem potrzeb, które należy uwzględnić podczas kompresji, aby zapewnić, że będzie zrozumiała i względnie przyjemna do słuchania. Wiele programów zaprojektowano specjalnie z myślą o kompresji mowy, w tym programy, które mogą wykonywać dodatkowe funkcje, takie jak szyfrowanie skompresowanych danych w celu zapewnienia bezpieczeństwa.
Surowe dane audio mogą zajmować dużo pamięci. Podczas kompresji dane są kompresowane, aby zajmowały mniej miejsca. Zwalnia to miejsce w pamięci, a staje się również ważne, gdy dane są przesyłane przez sieć. Na przykład w sieci telefonii komórkowej, jeśli stosowana jest kompresja mowy, w danym momencie można pomieścić większą liczbę użytkowników, ponieważ wymagana jest mniejsza przepustowość. Podobnie kompresja mowy staje się ważna w przypadku telekonferencji i innych aplikacji; wysyłanie danych jest drogie, a wszystko, co zmniejsza ilość danych, które należy wysłać, może pomóc obniżyć koszty.
Mowa jest stosunkowo prostym i szeroko przebadanym rodzajem danych audio, co ułatwia kompresję na różne sposoby. Ważne jest jednak, aby kompresja zachowała integralność mowy. Jeśli dane zostaną w jakiś sposób zniekształcone, może to być trudne do zrozumienia, a także może być trudne do słuchania. Dlatego kompresja mowy musi być wykonywana w sposób, który zachowuje kluczowe cechy danych. Łatwo jest, gdy mowa śpiewa „źle” dla słuchacza, zakłócając rozumienie przesyłanych danych.
Programy obsługujące tworzenie plików audio mogą mieć dostępną opcję kompresji. Po nagraniu lub wygenerowaniu nieprzetworzonego pliku audio ludzie mogą wybierać między wieloma parametrami, aby skompresować plik do łatwiejszego do zarządzania rozmiaru. Kompresję mowy można również wykonywać w locie, np. Gdy ludzie używają telefonów komórkowych, a sieć kompresuje dane podczas generowania sygnału danych, aby ludzie mogli rozmawiać w czasie rzeczywistym.
Jeśli dane również muszą zostać zaszyfrowane, można to zrobić w czasie rzeczywistym lub w drugim przebiegu, który szyfruje skompresowane dane. W takim przypadku osoba, która chce usłyszeć mowę, będzie musiała odszyfrować dane i uruchomić je za pomocą programu, który może być osadzony w urządzeniu, takim jak zabezpieczony telefon, który jest w stanie odczytać skompresowane dane.