Co je syntéza řeči?

Syntéza řeči je proces, kde je slovní komunikace replikována pomocí umělého zařízení. Počítač, který převádí text na řeč, je jeden druh syntetizátoru řeči.

Nejstarší formy syntézy řeči byly implementovány prostřednictvím strojů navržených tak, aby fungovaly jako lidský vokální trakt. Příkladem je mluvení vytvořený Wolfgang von Kempelen v 17. století. S tímto zařízením byla řeč vyráběna skrz kuchyň níže, dudský rákos a klarinetový zvon. Kuchyňská kuchyň byla navržena tak, aby působila jako plíce, zatímco Glottis (oblast hlasivek) byla zastoupena přes dudy. Klarinet zvon sloužil jako ústa.

Operace zařízení byla zcela manuální. Pravá ruka ovládala řadu pák, zatímco levá ruka manipulovala s klarinetovým zvonem (ústa). Byla také možnost připojit „nosní dírky“, aby vytvořily méně nosní zvuk. Ať tak či onak, pokud byly správně použity základní ovládací prvky, stroj recproudění vzduchu. Tento proudění vzduchu určovalo typy zvuků, které by byly vyrobeny.

Následné mluvené stroje během 18. a 19. století udržovaly toto nastavení, i když došlo k vylepšení. Například na konci 18. století vytvořil Joseph Faber stroj, který by mohl přijímat vstup prostřednictvím klávesnice a pedálu. Stroj byl také velmi kreativní, když zvuk vyšel přes umělou „tvář“.

Když se objevilo 20. století, inovace v elektronice umožnily syntéze řeči ještě silnější směr. Ačkoli předpoklad napodobování lidského vokálního traktu byl stále stejný, mluvení na počátku 20. století by mohly vyvolat lepší zvuky, protože vstup byl přesnější.

Až do příchodu počítačů však mohla být syntéza řeči skutečně použita mimo zábavní arénu. Je to hlavně proto, že SpeSyntetizátory ECH by mohly být uloženy v softwaru místo samostatného stroje. Navíc, s počítači jako pomoc, syntéza řeči by mohla mít jinou podobu; Použití lidských hlasů jako hlavního zdroje zvuku.

Tato forma syntézy řeči je známá jako přizpůsobení. Proces funguje spojováním různých záznamů lidské řeči. Výsledný zvuk je pro ucho mnohem přirozenější a příjemnější. To je na rozdíl od programů, které používají artikulační syntézu, kde je řeč replikována prostřednictvím počítačového modelu hlasového traktu.

Komerční syntetizátory řeči mohou používat buď cleanty nebo artikulační metody, ale oba jsou schopni dosáhnout stejného cíle; schopnost dát lidem příležitost slyšet text. To je zvláště užitečné v situacích, kdy je čtení rušivé nebo nemožné.

V obchodním světě jsou takové situace velmi běžné, zejména pro telefonní transakce. Bez alternativ textu na řeč (TTS), podnikáníMajitelé by museli utratit peníze najímání ještě více zaměstnanců zákaznických služeb. Syntetizovaná řešení se tomuto problému vyhýbají, protože vše se provádí počítačem; ne lidská bytost.

Syntetizovaná řeč také hraje roli v každodenním životě, zejména pro jednotlivce, kteří jsou zdravotně postiženi. Mluvící hodiny, slovníky a další zařízení mohou usnadnit věci lidem, kteří mají potíže s viděním nebo čtením. Syntetizovaná řeč je dokonce schopna dát hlas jednotlivcům, kteří nemohli vůbec mluvit. Prominentním příkladem je Steven Hawking, slavný fyzik. Vzhledem k tomu, že ho Lou Gehrigova choroba způsobila ztlumení, Hawking používá ke komunikaci s lidmi syntetizér hlasu.

K dispozici jsou také aplikace TTS, které pomáhají lidem s různými počítačovými aktivitami. K získání těchto typů aplikací bude většina uživatelů muset koupit samostatný software nebo stahovat záplaty. Druhá možnost je obvykle zdarma, v závislosti na používání operačního systému nebo programu zpracování textu. Však,Pokud se osoba rozhodne koupit samostatný software, mohl by mít přístup k kvalitnějšímu systému. Konkrétní příklady lze vidět prostřednictvím přirozené čtečky 7 a textu nahlas 2.

Nakonec je syntéza řeči technologie, která revolucionizovala, jak lidstvo komunikuje. V jistém smyslu dává text vlastní život. Dává také světu příležitost slyšet myšlenky brilantních jednotlivců, kteří by normálně byli neznělý.

Co je syntéza řeči?

JINÉ JAZYKY

SOUVISEJÍCÍ ČLÁNKY

Jak můžeme pomoci?