Hva er en talesynthesizer?
Talesyntesen er en enhet som brukes til å oversette teksttegn til lyder som tilnærmer seg lyden av menneskelig tale. Avhengig av grad av sofistikering av den enkelte enhet, kan lydene som produseres være noe stilte og kunstige, eller høres veldig ut som stemmen til en ekte person. Begrepet talesyntese har eksistert i århundrer, men først de siste tiårene har prosessen blitt tilgjengelig for allmennheten.
Det er eksempler på forsøk på kunstig å produsere menneskelige talemønstre som går tilbake til 1000-tallet. De tidligste forsøkene brukte ofte materialer for å gjenskape menneskelige stemmebånd og anvende ulike typer stimulering for å produsere lyder. Over tid gjorde design det mulig å produsere lyder som etterlignet uttalelsen av vokaler. Ved siste del av 1700-tallet var det få design som også var i stand til å produsere lyder som lignet konsonanter.
Den virkelige fremgangen med den moderne talesyntesen begynte på 1930-tallet. Bell Laboratories produserte en synthesizer som ble kalt vocoder. Data ble lagt inn med bruk av et tastatur, analysert av systemet, og passende lyder som ble sendt ut for å danne ord. Mens intonasjonen og bøyningen av ordene var noe primitive, produserte enheten klart forståelige ord. En raffinert versjon av denne enheten, voder, ble introdusert for publikum på verdensmessen i 1939.
På 1950-tallet ga arbeidet med en talesynthesizer som ville bruke visuelle bilder så vel som lagt inn tekst delvis vellykkede resultater. Samtidig begynte fremskritt innen teknologi å avgrense lydkvaliteten. Da automatisert stemmekommunikasjon ble mer utbredt på 1970-tallet, var det flere talesynteser som var i stand til å produsere lyder som var veldig nær menneskelige talemønstre. På kort tid ble enhetene brukt til å produsere slike produkter som forhåndsinnspilte meldinger på telefonsvarer og leseprodukter for personer med svaksynte.
Ankomsten av den personlige datamaskinen åpnet også døren for ytterligere forbedringer for talesyntesen. Ved å inkludere enheten på et hjemmecomputersystem kan personer med lesevansker eller begrenset syn kunne glede seg over å bruke en rekke dataprogrammer. I dag er stemmekvaliteten på de fleste modeller av talesynthesizeren fjernet fra robotlydene produsert av enheter opprettet på begynnelsen av 1900-tallet. Mange versjoner i dag er i stand til å produsere stemmemønstre som nesten ikke kan skilles fra menneskelig tale.