O que é SAPI?
A SAPI (Speech Application Programming Interface) é uma interface de áudio desenvolvida pela Microsoft. Projetada para uso em sistemas operacionais Windows, a idéia por trás do SAPI era possibilitar o uso de síntese e reconhecimento de fala na função de vários aplicativos Windows. Diferentes versões da API do discurso foram lançadas desde a primeira versão, em 1995. Algumas são padrão em todos os sistemas operacionais Windows, enquanto outras são personalizadas para uso em programas específicos.
A aplicação do SAPI amplia a gama de consumidores que podem desfrutar de programas baseados no Windows. Devido ao aspecto de reconhecimento de fala do SAPI, é possível que pessoas fisicamente limitadas por condições temporárias ou permanentes continuem trabalhando com programas de processamento de texto e outros princípios básicos. Ao mesmo tempo, o SAPI tem a capacidade de traduzir texto para a palavra falada. Esse recurso pode ser especialmente útil para pessoas com visão prejudicada, pois possibilita a interação com o conteúdo de um site ou simplesmente o recebimento de emails de amigos e parentes.
Nas versões mais antigas do SAPI, a capacidade da interface era de qualidade um pouco baixa quando comparada às versões em uso atualmente. A programação permitiu a criação de reprodução sonora de natureza um tanto robótica. Embora eficazes por sua época, as inovações em versões posteriores aprimoraram a qualidade da reprodução da voz, incluindo palavras faladas por seres humanos e arquivadas para uso do programa quando necessário. Quando uma voz SAPI não é criada eletronicamente, as pessoas que treinaram no trabalho de voz são frequentemente usadas para criar esses arquivos. Por exemplo, um artista que ganha a vida fazendo propaganda de rádio ou locução para comerciais na televisão seria um excelente candidato para criar arquivos de texto em fala que podem ser usados pelo SAPI.
A versão mais recente do SAPI inclui vários recursos aprimorados. Entre eles, está a capacidade de ajustar a velocidade, o volume e o tom da voz, além de aprimorar a pronúncia. Interpretações semânticas permitem obter definições de palavras que não são facilmente compreendidas. Novas versões do SAPI são lançadas a cada poucos anos, com cada versão oferecendo algum aprimoramento ou aprimoramento das funções existentes que tornam a interface cada vez mais útil em vários aplicativos.