Vad är en talsynthesizer?
Talesyntesen är en enhet som används för att översätta texttecken till ljud som ungefär ljudet från mänskligt tal. Beroende på nivån på sofistikeringen för den enskilda enheten kan de producerade ljuden vara något stilt och konstgjorda, eller låter väldigt mycket som en riktig persons röst. Begreppet talesyntes har funnits i århundraden, men först under de senaste decennierna har processen blivit tillgänglig för allmänheten.
Det finns exempel på försök att konstgjorda mänskliga talmönster som går tillbaka till 1100-talet. De tidigaste försöken använde ofta material för att replikera mänskliga stämband och tillämpa olika typer av stimulering för att producera ljud. Med tiden gjorde mönster det möjligt att producera ljud som efterliknade uttalet av vokaler. Vid den senare delen av 1700-talet kunde ett fåtal mönster också producera ljud som liknade konsonanter.
De verkliga framstegen med den moderna talsyntesen började på 1930-talet. Bell Laboratories producerade en synthesizer som kallades vocoder. Data matades in med användning av ett tangentbord, analyserat av systemet och lämpliga ljud som avges för att bilda ord. Medan ordens intonation och böjning var något primitiv producerade enheten tydligt begripliga ord. En förfinad version av denna enhet, voder, introducerades för allmänheten på 1939 World Fair.
Vid 1950-talet gav arbetet med en talsyntes som skulle använda visuella bilder samt inmatad text delvis framgångsrika resultat. Samtidigt började teknikens framsteg förfina ljudkvaliteten. När den automatiska röstkommunikationen blev mer utbredd på 1970-talet fanns det flera talsynteser som kunde producera ljud som var mycket nära mänskliga talmönster. På kort tid användes enheterna för att producera sådana produkter som förinspelade meddelanden på telefonsvarare och läsprodukter för personer med synskadade.
Tillkomsten av persondatorn öppnade också dörren till ytterligare förbättringar för talsyntesen. Genom att inkludera enheten i ett hemdatorsystem kan personer med läshinder eller begränsad syn njuta av att använda olika datorprogram. Idag är röstkvaliteten på de flesta modeller av talsyntesen långt bort från robotljuden som producerats av enheter som skapades i början av 1900-talet. Många versioner idag kan producera röstmönster som nästan inte kan skiljas från mänskligt tal.