Co to jest syntezator mowy?
Syntezator mowy to urządzenie służące do tłumaczenia znaków tekstowych na dźwięki zbliżone do mowy ludzkiej. W zależności od stopnia zaawansowania poszczególnych urządzeń wytwarzane dźwięki mogą być nieco stilowane i sztucznie brzmiące lub brzmieć bardzo podobnie do głosu prawdziwej osoby. Koncepcja syntezy mowy istnieje od wieków, ale dopiero w ostatnich dziesięcioleciach proces ten stał się dostępny dla ogółu społeczeństwa.
Istnieją przykłady prób sztucznego tworzenia wzorów mowy ludzkiej, które sięgają XI wieku. W pierwszych próbach często wykorzystywano materiały do odtwarzania ludzkich strun głosowych i stosowania różnych rodzajów stymulacji w celu uzyskania dźwięków. Z czasem projekty umożliwiły wytwarzanie dźwięków naśladujących wymowę samogłosek. W drugiej połowie XVIII wieku kilka projektów było w stanie wytwarzać dźwięki, które bardzo przypominały spółgłoski.
Prawdziwy postęp we współczesnym syntezatorze mowy rozpoczął się w latach 30. XX wieku. Bell Laboratories wyprodukowało syntezator, który został nazwany wokoderem. Dane wprowadzano za pomocą klawiatury, analizowanej przez system i emitowano odpowiednie dźwięki w celu utworzenia słów. Podczas gdy intonacja i odmiana słów były nieco prymitywne, urządzenie wytwarzało wyraźnie zrozumiałe słowa. Udoskonalona wersja tego urządzenia, voder, została zaprezentowana publiczności na Światowych Targach w 1939 roku.
W latach pięćdziesiątych prace nad syntezatorem mowy, który wykorzystywałby zarówno obrazy wizualne, jak i wprowadzony tekst, przyniosły częściowo pomyślne wyniki. Jednocześnie postęp technologiczny zaczął poprawiać jakość dźwięku. Kiedy automatyczna komunikacja głosowa stała się bardziej rozpowszechniona w latach 70. XX wieku, istniało kilka syntezatorów mowy, które były w stanie wytwarzać dźwięki, które były bardzo zbliżone do ludzkich wzorców mowy. W krótkim czasie urządzenia te były wykorzystywane do produkcji takich produktów, jak wstępnie nagrane wiadomości na automatycznych sekretarkach i produkty do czytania dla osób niedowidzących.
Pojawienie się komputera osobistego otworzyło również drzwi do dalszych udoskonaleń syntezatora mowy. Dzięki włączeniu urządzenia do domowego systemu komputerowego osoby z trudnościami w czytaniu lub ograniczonym widzeniem mogą korzystać z różnych programów komputerowych. Dzisiaj jakość głosu w większości modeli syntezatora mowy jest daleka od robotycznych dźwięków wytwarzanych przez urządzenia stworzone na początku XX wieku. Wiele dzisiejszych wersji jest w stanie wytwarzać wzorce głosu, które są prawie nie do odróżnienia od ludzkiej mowy.