Was ist ein Embedded TTS?

Embedded TTS ist eine Text-to-Speech-Technologie, die die Sprache in ein Softwarepaket einbettet, das dann für den praktischen Gebrauch auf den Markt gebracht wird. Die Sprachsoftware kann auf mehreren Plattformen verwendet werden und hat praktische Auswirkungen auf eine Reihe von Gebieten. Embedded TTS ist eine relativ neue Technologie, die sich mit der Zeit verbessern wird, obwohl die neuesten Produkte eine nahezu natürlich klingende Sprache bieten.

Der Zweck von eingebettetem TTS besteht darin, den Platz von Text in Anwendungen einzunehmen, bei denen das Lesen unpraktisch oder unmöglich ist. Insbesondere für Blinde ist die Verwendung eines Computers mit eingebettetem TTS einfacher. Dies ist jedoch nicht die einzige Anwendung. Die Telefonkommunikation bietet beispielsweise keine Möglichkeit, die Informationen zu lesen, die der andere Teilnehmer zu übermitteln versucht. Daher könnte in einer solchen Umgebung eingebettetes TTS ohne den Nutzen einer lebenden Person sehr wertvoll sein. Eine weitere häufig verwendete Anwendung sind GPS-Navigationssysteme. Oft ist es für den Fahrer einfach zu gefährlich, Anweisungen auf einem kleinen Bildschirm abzulesen. Die Verwendung von eingebettetem TTS in dieser Situation ermöglicht es dem Fahrer, die nächste Richtung zu hören.

Während frühe Versuche mit eingebettetem TTS als ärgerliche Produkte endeten, die sich nicht naturgetreu anhörten und nur schwer zu verfolgen waren, wurden seitdem viele Fortschritte erzielt. Die frühen Produkte fügten die aufgenommenen Wörter einfach so zusammen, wie sie in einem Satz erschienen, ohne eine bestimmte Beugung oder einen bestimmten Ton. Dies verursachte eine sehr kaputte Form der Kommunikation, fast wie eine Computerstimme aus der ursprünglichen Star Trek-Serie, nur schlimmer.

Die Technologie hat sich seitdem so weit verbessert, dass jetzt jeder einzelne Klang zerlegt und zu Wörtern zusammengefügt wird. Viele dieser Wörter werden von sehr angenehm klingenden Stimmen gesprochen. In vielen Fällen kann es schwierig sein, zu unterscheiden, ob die Stimme eine lebende Person ist oder nicht. Die Technologie hörte hier jedoch nicht auf.

Zum ersten Mal verstand Embedded TTS, dass das Sprechen von Wörtern nur ein Teil der Gleichung war. Diese Wörter und die ihnen gegebenen Laute klingen je nach dem Teil des Satzes, in dem sie sich befinden, unterschiedlich. Daher trug die eingebettete TTS-Software auch diesem Faktor Rechnung, sodass die Stimmen in natürlichem Fluss und Stil sprechen können, solange die Grammatik dies zulässt ist richtig geschrieben.

Die Implementierung der Technologie kann zwar teuer sein, wird jedoch von vielen als Möglichkeit zur Rationalisierung des Geschäftsbetriebs angesehen. Bei der täglichen Bearbeitung von Hunderten oder Tausenden von Anrufen müssen viele Bediener mit der Lautstärke fertig werden. Das ist auch teuer. Die Verwendung von eingebettetem TTS in mindestens einigen dieser Positionen könnte zu erheblichen Kosteneinsparungen führen.

Was ist ein Embedded TTS?

War dieser Artikel hilfreich?