Hva er sammenhengen mellom talesyntese og anerkjennelse?
Talesyntese og anerkjennelse er de to sidene ved datamatisert taleanalyse. Talesyntese er å skape menneskelig tale av en datamaskin; for eksempel en datamaskin som leser skrevet tekst. Talegjenkjenning er å lage datamaskininformasjon fra talte ord, for eksempel diktere papir til en datamaskin. Mens de to prosessene ikke er direkte relatert, er talesyntese og anerkjennelse begge avhengige av datamaskinens evne til å forstå menneskelig tale og bøyning. Den ene metoden er output og den andre er input.
Prosessene som brukes ved talesyntese og anerkjennelse er veldig like, selv om sluttproduktet er annerledes. Prosessen består av to deler, en del med menneskelig interaksjon og en uten. Den menneskelige delen er når menneskelige ord kommer inn i programmet; den ikke-menneskelige delen er når programmet interopererer innspillene.
Et talesynteseprogram vil ta inn menneskelige innspill i form eller skrevet eller skrevet menneskelig språk. Programmet vil lese språket og bestemme hva hvert ord er, ved å bruke setningsplassering og tegnsetting for å bestemme bøyning. Når et ord kan uttales flere måter, for eksempel i tilfelle 'live', vil programmet lete etter ord i nærheten og kontekstledetråder for å bestemme hvilket ord som faktisk brukes. Ordene går deretter til den andre delen av programmet, der de snakkes høyt.
I et talegjenkjenningsprogram er prosessen motsatt. Innspillet kommer fra en menneskelig høyttaler som sier ord til en datamaskin. Datamaskinen vil lytte til hvert ord og sammenligne mønsteret som genereres av talerens stemme med et bibliotek med mulige lyder og ord. Den gjør deretter en bestemmelse av det mest sannsynlige ordet og sender det til den andre delen av systemet. Denne delen trykker faktisk ordene ut på skjermen, i likhet med hvordan synteseprogrammet sier ordene.
Siden hver høyttaler høres litt annerledes ut, har talesyntese- og gjenkjennelsesprogrammer ofte en bred feilmargin. En av måtene folk bekjempe disse feilene er gjennom individualiserte taleprofiler. En enkelt foredragsholder vil få talen sin analysert av programmet for å finne hans spesifikke vokale mønstre. Når han finner feil i datamaskinoversettelsen, kan han rette dem spesifikt. Korreksjonene blir analysert og lagret av programmet, så når det plagsomme ordet kommer opp igjen, vil programmet oversette det riktig.
Det er en bred applikasjon for talesyntese- og anerkjennelsesprogrammer. I det medisinske feltet tillater disse programmene folk å kommunisere som ellers kanskje ikke er i stand til det. Disse programmene har en bred applikasjon i virksomheten som et raskere middel til å oversette rapporter og dokumenter. Talegjenkjenning er også en vanlig metode for å sette opp håndfrie enheter i biler, slik at folk kan snakke i telefonen på en tryggere måte mens de kjører.