¿Qué es SAPI?
La interfaz de programación de aplicaciones de voz (SAPI) es una interfaz de audio desarrollada por Microsoft. Diseñado para su uso dentro de los sistemas operativos de Windows, la idea detrás de SAPI era hacer posible el uso de la síntesis y el reconocimiento del habla dentro de la función de varias aplicaciones de Windows. Se han lanzado diferentes versiones de la API del Speech desde que apareció la primera versión en 1995. Algunas son estándar con todos los sistemas operativos de Windows, mientras que otros están personalizados para su uso con programas específicos.
La aplicación de SAPI amplía la gama de consumidores que pueden disfrutar del uso de programas basados en Windows. Debido al aspecto de reconocimiento de voz de SAPI, es posible que las personas que pueden estar físicamente limitadas por condiciones temporales o permanentes sigan trabajando con programas de procesamiento de textos y otros conceptos básicos. Al mismo tiempo, SAPI tiene la capacidad de traducir texto a la palabra hablada. Esta característica puede ser especialmente útil para personas con visión deteriorada, ya que la hace POssible interactuar con el contenido en un sitio web o simplemente poder disfrutar de recibir el correo electrónico de amigos y familiares.
En las primeras versiones de SAPI, la capacidad de la interfaz era algo baja en calidad en comparación con las versiones en uso hoy. La programación permitió la creación de reproducción de sonido que era de naturaleza algo robótica. Si bien es efectivo para su tiempo, las innovaciones en versiones posteriores mejoraron la calidad de la reproducción de voz para incluir palabras habladas por humanos y archivadas para su uso por el programa cuando sea necesario. Cuando una voz de SAPI no se crea electrónicamente, las personas que entrenadas en el trabajo de voz a menudo se usan para crear estos archivos. Por ejemplo, un intérprete que se gana la vida haciendo radio anunciando o con voz sobre el trabajo para los comerciales en la televisión sería un excelente candidato para crear archivos de texto a voz que puede ser utilizado por SAPI.
El más recenLa versión T de SAPI incluye una serie de características mejoradas. Entre ellos está la capacidad de ajustar la velocidad, el volumen y el tono de la voz, así como mejorar la pronunciación. Las interpretaciones semánticas permiten obtener definiciones de palabras que no se entienden fácilmente. Se lanzan nuevas versiones de SAPI cada pocos años, con cada versión que ofrece algo de mejora o refinamiento de las funciones existentes que hacen que la interfaz sea cada vez más útil en varias aplicaciones.