Jaki jest związek między syntezą mowy a rozpoznawaniem?

Synteza i rozpoznawanie mowy to dwie strony komputerowej analizy mowy. Synteza mowy to tworzenie mowy ludzkiej przez komputer; na przykład komputer czyta napisany tekst. Rozpoznawanie mowy to tworzenie informacji komputerowych na podstawie wypowiadanych słów, takich jak dyktowanie gazety komputerowi. Chociaż oba procesy nie są ze sobą bezpośrednio powiązane, synteza i rozpoznawanie mowy zależą od zdolności komputera do rozumienia mowy ludzkiej i fleksji. Jedna metoda jest wyprowadzana, a druga jest wprowadzana.

Procesy syntezy i rozpoznawania mowy są bardzo podobne, nawet jeśli produkt końcowy jest inny. Proces składa się z dwóch części, jednej z interakcją człowieka, a drugiej bez. Część ludzka ma miejsce, gdy ludzkie słowa wchodzą do programu; część inna niż ludzka występuje, gdy program współdziała z danymi wejściowymi.

Program do syntezy mowy przyjmie ludzki wkład w formie ludzkiego lub pisanego na maszynie lub pisanego języka. Program odczyta język i określi, jakie jest każde słowo, przy użyciu umiejscowienia zdań i interpunkcji w celu określenia fleksji. Kiedy słowo można wymówić na wiele sposobów, na przykład w przypadku słowa „na żywo”, program wyszuka pobliskie słowa i wskazówki kontekstowe, aby ustalić, które słowo jest rzeczywiście używane. Słowa przejdą następnie do drugiej części programu, gdzie zostaną wypowiedziane na głos.

W programie do rozpoznawania mowy proces jest odwrotny. Wkład pochodzi od człowieka mówiącego słowa do komputera. Komputer wysłucha każdego słowa i porówna wzór generowany przez głos mówcy z biblioteką możliwych dźwięków i słów. Następnie ustala najbardziej prawdopodobne słowo i wysyła je do drugiej części systemu. Ta część faktycznie wypisuje słowa na ekranie, podobnie jak słowa syntezatora.

Ponieważ każdy głośnik brzmi nieco inaczej, programy do syntezy mowy i rozpoznawania często mają szeroki margines błędu. Jednym ze sposobów walki z tymi błędami są zindywidualizowane profile mowy. Jeden mówca będzie analizował swoją mowę przez program, aby znaleźć swoje specyficzne wzorce wokalne. Gdy znajdzie błędy w tłumaczeniu komputerowym, może je konkretnie poprawić. Poprawki są analizowane i zapisywane przez program, więc gdy kłopotliwe słowo pojawi się ponownie, program przetłumaczy je poprawnie.

Istnieje szerokie zastosowanie dla programów do syntezy i rozpoznawania mowy. W dziedzinie medycyny programy te pozwalają komunikować się z ludźmi, którzy w innym przypadku mogliby tego nie zrobić. Programy te mają szerokie zastosowanie w biznesie jako szybszy sposób tłumaczenia raportów i dokumentów. Rozpoznawanie mowy jest również powszechną metodą konfigurowania urządzeń głośnomówiących w samochodach, umożliwiając bezpieczniejszą rozmowę przez telefon podczas jazdy.

Jaki jest związek między syntezą mowy a rozpoznawaniem?

Czy ten artykuł był pomocny?