Jaki jest związek między syntezą mowy a rozpoznawaniem?

Synteza i rozpoznawanie mowy

to dwie strony skomputeryzowanej analizy mowy. Synteza mowy jest tworzeniem ludzkiej mowy przez komputer; Na przykład tekst czytania komputera. Rozpoznawanie mowy jest tworzeniem informacji komputerowych ze słów mówionych, takich jak dyktowanie papieru do komputera. Chociaż dwa procesy nie są bezpośrednio powiązane, synteza mowy i rozpoznawanie opierają się zarówno na zdolności komputera do zrozumienia ludzkiej mowy i fleksji. Jedna metoda jest wyjściowa, a druga wprowadza się.

Procesy stosowane przez syntezę i rozpoznawanie mowy są bardzo podobne, nawet jeśli produkt końcowy jest inny. Proces składa się z dwóch części, jednej części z interakcją człowieka i jednej bez. Część ludzka ma miejsce, gdy ludzkie słowa wchodzą do programu; Część nie-ludzka polega na tym, że program interopuje dane wejściowe.

Program syntezy mowy przyjmie wkład w formie lub wpisany lub pisemny język ludzki. Program przeczyta język i określi WKapelusz Każde słowo jest, używając umiejscowienia i interpunkcji zdań w celu określenia fleksji. Gdy słowo można było wymówić na wiele sposobów, na przykład w przypadku „Live”, program będzie szukał pobliskich słów i wskazówek kontekstowych w celu ustalenia, które słowo jest faktycznie używane. Słowa trafiają następnie do drugiej części programu, gdzie są wypowiedziane na głos.

W programie rozpoznawania mowy proces jest odwrotny. Wkład pochodzi od ludzkiego mówcy wypowiadającego słowa do komputera. Komputer będzie słuchać każdego słowa i porównuje wzór generowany przez głos mówcy z biblioteką możliwych dźwięków i słów. Następnie określa najbardziej prawdopodobne słowo i wysyła je do drugiej części systemu. Ta część faktycznie drukuje słowa na ekranie, podobnie jak program syntezy mówi słowa.

Ponieważ każdy głośnik brzmi nieco inaczej, synteza mowy iProgramy rozpoznawania często mają szeroki margines błędu. Jednym ze sposobów, w jaki ludzie walczą z tymi błędami, są zindywidualizowane profile mowy. Jeden mówca przeanalizuje jego mowę w celu znalezienia jego specyficznych wzorów wokalnych. Kiedy znajdzie błędy w tłumaczeniu komputerowym, może je konkretnie poprawić. Korekty są analizowane i przechowywane przez program, więc kiedy pojawi się kłopotliwe słowo, program poprawnie je przetłumaczy.

Istnieje szerokie zastosowanie programów syntezy i rozpoznawania mowy. W dziedzinie medycyny programy te pozwalają ludziom komunikować się, którzy inaczej nie mogą nie być. Programy te mają szeroką aplikację w biznesie jako szybszy sposób tłumaczenia raportów i dokumentów. Rozpoznawanie mowy jest również powszechną metodą konfigurowania urządzeń bez użycia głośnomówiącego w samochodach, umożliwiając ludziom bezpieczniejsze rozmowy przez telefon podczas jazdy.

INNE JĘZYKI