Was ist SAPI?
Das Speech Application Programming Interface (SAPI) ist ein von Microsoft entwickeltes Audio-Interface. Die Idee von SAPI, die für den Einsatz in Windows-Betriebssystemen entwickelt wurde, war es, die Verwendung von Sprachsynthese und Spracherkennung innerhalb der Funktion verschiedener Windows-Anwendungen zu ermöglichen. Seit dem Erscheinen der ersten Version im Jahr 1995 wurden verschiedene Versionen der Speech-API veröffentlicht. Einige sind Standard bei allen Windows-Betriebssystemen, während andere für die Verwendung mit bestimmten Programmen angepasst sind.
Die Anwendung von SAPI erweitert den Kreis der Benutzer, die Windows-basierte Programme nutzen können. Aufgrund des Spracherkennungsaspekts von SAPI können Personen, die möglicherweise durch vorübergehende oder dauerhafte Bedingungen physisch eingeschränkt sind, weiterhin mit Textverarbeitungsprogrammen und anderen Grundlagen arbeiten. Gleichzeitig kann SAPI Text in das gesprochene Wort übersetzen. Diese Funktion kann besonders für Personen mit Sehbehinderung hilfreich sein, da sie es ermöglicht, mit Inhalten auf einer Website zu interagieren oder einfach nur E-Mails von Freunden und Verwandten zu erhalten.
In den frühesten Versionen von SAPI war die Fähigkeit der Schnittstelle im Vergleich zu den heute verwendeten Versionen von etwas geringerer Qualität. Die Programmierung ermöglichte die Erzeugung einer Tonwiedergabe, die etwas roboterhafter Natur war. Innovationen in späteren Versionen haben die Qualität der Sprachwiedergabe verbessert, da sie von Menschen gesprochene und für das Programm bei Bedarf archivierte Wörter enthielten. Wenn eine SAPI-Stimme nicht elektronisch erstellt wird, werden diese Archive häufig von Personen erstellt, die in Spracharbeit geschult wurden. Ein Künstler, der seinen Lebensunterhalt mit Radioansagen oder Voice-over-Arbeiten für Werbespots im Fernsehen verdient, ist beispielsweise ein hervorragender Kandidat für die Erstellung von Text-to-Speech-Archiven, die von SAPI verwendet werden können.
Die neueste Version von SAPI enthält eine Reihe erweiterter Funktionen. Dazu gehört die Möglichkeit, die Geschwindigkeit, Lautstärke und Tonhöhe der Stimme anzupassen und die Aussprache zu verbessern. Semantische Interpretationen ermöglichen es, Definitionen von Wörtern zu erhalten, die nicht leicht zu verstehen sind. Alle paar Jahre werden neue Versionen von SAPI veröffentlicht, wobei jede Version einige Verbesserungen oder Verfeinerungen bestehender Funktionen bietet, die die Benutzeroberfläche in einer Reihe von Anwendungen immer nützlicher machen.