Wat is een embedded TTS?
Embedded TTS is tekst-naar-spraaktechnologie die de spraak insluit in een softwarepakket dat vervolgens voor praktisch gebruik op de markt wordt gebracht. De spraaksoftware kan op meerdere platforms worden gebruikt en heeft praktische implicaties op een aantal gebieden. Embedded TTS is een relatief nieuwe technologie die in de loop van de tijd zal verbeteren, hoewel de nieuwste producten claimen dat ze bijna natuurlijk klinken.
Het doel van embedded TTS is om tekst te vervangen in toepassingen waar lezen onpraktisch of onmogelijk is. Vooral de blinden zullen het gebruik van een computer met ingebedde TTS gemakkelijker vinden. Dat is echter niet de enige toepassing. Telefonische communicatie biedt bijvoorbeeld geen kans om de informatie te lezen die de andere partij probeert over te brengen. Daarom zou ingebedde TTS zonder het voordeel van een levend persoon zeer waardevol kunnen zijn in een dergelijke omgeving. Een andere toepassing waar het vaak wordt gezien, is GPS-navigatiesystemen. Vaak is het simpelweg te gevaarlijk voor de bestuurder om te proberen de aanwijzingen op een klein scherm te lezen. Door ingebedde TTS in deze situatie te gebruiken, kan de bestuurder de volgende richting horen.
Hoewel vroege pogingen tot ingebedde TTS eindigden als irritante producten die niet levensecht klonken en heel moeilijk te volgen waren, zijn er sinds die tijd veel vorderingen gemaakt. De vroege producten brachten opgenomen woorden eenvoudig samen op de manier waarop ze in een zin verschenen, zonder specifieke verbuiging of geluid. Dit veroorzaakte een zeer verbroken vorm van communicatie, bijna als een computerstem uit de originele Star Trek-serie, alleen erger.
De technologie is sindsdien verbeterd tot het punt waarop nu elk individueel geluid wordt onderverdeeld en samengevoegd om woorden te creëren. Veel van die woorden worden gesproken door een aantal zeer aangenaam klinkende stemmen. In veel gevallen kan het moeilijk zijn om te onderscheiden of de stem een levend persoon is of niet. Daar stopte de technologie echter niet.
Voor het eerst begon embedded TTS te begrijpen dat het zeggen van woorden slechts een deel van de vergelijking was. Die woorden, en de geluiden die ze kregen, klinken anders, afhankelijk van welk deel van de zin ze bevatten. Daarom is ingesloten TTS-software ook verantwoordelijk voor die factor, waardoor de stemmen in natuurlijke flow en stijl kunnen spreken, zolang de grammatica is correct geschreven.
Hoewel de technologie duur kan zijn om te implementeren, beschouwen velen deze als een manier om bedrijfsactiviteiten te stroomlijnen. Degenen die dagelijks honderden of duizenden oproepen afhandelen, hebben veel operators nodig om het volume te verwerken. Dat is ook duur. Het gebruik van ingebedde TTS in ten minste sommige van die posities kan aanzienlijke kostenbesparingen opleveren.