Hva er talesyntese?
Talesyntese er en prosess der verbal kommunikasjon blir replikert gjennom et kunstig apparat. En datamaskin som konverterer tekst til tale, er en slags talesynteser.
De tidligste formene for talesyntese ble implementert gjennom maskiner designet for å fungere som den menneskelige vokalveien. Talemaskinen skapt av Wolfgang von Kempelen på 1700-tallet er et eksempel. Med denne enheten ble det produsert tale gjennom en kjøkkenbælg, en sekkepipe-rør og en klarinettklokke. Kjøkkenbælgen var designet for å fungere som en lunge, mens glottis (området med stemmebåndene) ble representert gjennom sekkepipe-vassdraget. Klarinettklokka tjente som munnen.
Betjeningen av enheten var fullstendig manuell. Høyre hånd kontrollerte en serie spaker mens venstre hånd manipulerte klarinettklokken (munnen). Det var også muligheten til å koble 'neseborene' for å produsere en mindre nasal lyd. Uansett, så lenge de grunnleggende kontrollene ble brukt på riktig måte, fikk maskinen luftstrøm. Denne luftstrømmen bestemte hvilke typer lyder som ville bli produsert.
Etterfølgende talemaskiner gjennom 1700- og 1800-tallet opprettholdt dette oppsettet, selv om det var forbedringer. På slutten av 1800-tallet opprettet for eksempel Joseph Faber en talemaskin som kunne motta innspill gjennom et tastatur og en pedal. Maskinen var også veldig kreativ, da lyden kom ut gjennom et kunstig "ansikt."
Da 1900-tallet kom, tillot innovasjoner innen elektronikk talesyntese å ta en enda kraftigere retning. Selv om forutsetningen om å imitere den menneskelige vokalveien fortsatt var den samme, kunne talende maskiner på begynnelsen av 1900-tallet produsere bedre lyder siden innspillet var mer presist.
Imidlertid var det ikke før datamaskinens ankomst at talesyntese faktisk kunne brukes utenfor underholdningsarenaen. Dette er hovedsakelig fordi talesynteser kan lagres i programvare i stedet for en egen maskin. I tillegg, med datamaskiner som et hjelpemiddel, kan talesyntese ha en annen form; bruker menneskelige stemmer som hovedkilde for lyd.
Denne formen for talesyntese er kjent som konkatenativ. Prosessen fungerer ved å koble til forskjellige innspillinger av menneskelig tale. Den resulterende lyden er mye mer naturlig og behagelig for øret. Dette i motsetning til programmer som bruker artikulerende syntese, der tale blir replikert gjennom en datastyrt modell av vokalveiene.
Kommersielle talesynteser kan benytte seg av konkatenative eller artikulerende metoder, men begge er i stand til å oppnå samme mål; å kunne gi folk en mulighet til å høre tekst. Dette er spesielt nyttig i situasjoner der lesing er påtrengende eller umulig.
I næringslivet er slike situasjoner veldig vanlige, spesielt for telefontransaksjoner. Uten tekst-til-tale-alternativer (TTS) ville bedriftseiere måtte bruke penger på å ansette enda mer kundeservicepersonell. Syntetiserte løsninger unngår dette problemet, siden alt gjøres av datamaskiner; ikke et menneske.
Syntetisert tale spiller også en rolle i dagliglivet, spesielt for funksjonshemmede. Å snakke klokker, ordbøker og andre enheter kan gjøre ting lettere for folk som har problemer med å se eller lese. Syntetisert tale er til og med i stand til å gi en stemme til enkeltpersoner som ikke kunne snakke i det hele tatt. Steven Hawking, en kjent fysiker, er et fremtredende eksempel. Siden Lou Gehrigs sykdom har gjort ham stum, bruker Hawking en stemmesynthesisator for å kommunisere med mennesker.
Det er også TTS-applikasjoner tilgjengelig for å hjelpe mennesker med forskjellige datamaskinaktiviteter. For å få denne typen applikasjoner, vil de fleste brukere måtte kjøpe separat programvare eller laste ned oppdateringer. Det siste alternativet er vanligvis gratis, avhengig av operativsystem eller tekstbehandlingsprogram som brukes. Imidlertid, hvis en person bestemmer seg for å kjøpe separat programvare, kan de ha tilgang til et system av høyere kvalitet. Spesifikke eksempler kan sees gjennom Natural Reader 7 og Text Aloud 2.
Til syvende og sist er talesyntese teknologi som har revolusjonert hvordan menneskeheten kommuniserer. På en måte gir den teksten et eget liv. Det gir også verden en mulighet til å høre tankene til strålende individer som normalt ville vært stemmeløse.