Qual é a conexão entre a síntese e o reconhecimento da fala?

A síntese e o reconhecimento da fala são os dois lados da análise informatizada da fala. A síntese de fala é a criação da fala humana por um computador; Por exemplo, um computador de leitura de computador escrito. O reconhecimento de fala é a criação de informações do computador de palavras faladas, como ditar um papel para um computador. Embora os dois processos não estejam diretamente relacionados, a síntese e o reconhecimento da fala dependem da capacidade do computador de entender a fala e a inflexão humanas. Um método é emitido e o outro é a entrada.

Os processos usados ​​pela síntese e reconhecimento da fala são muito semelhantes, mesmo que o produto final seja diferente. O processo consiste em duas partes, uma parte da interação humana e uma sem. A parte humana é quando as palavras humanas entram no programa; A parte não humana é quando o programa interopere a entrada. O programa lerá o idioma e determinará WCada palavra é, usando a colocação e pontuação da frase para determinar a inflexão. Quando uma palavra pode ser pronunciada de várias maneiras, como no caso de "Live", o programa procurará palavras próximas e pistas de contexto para determinar qual palavra está realmente sendo usada. As palavras irão então para a segunda parte do programa, onde são faladas em voz alta.

Em um programa de reconhecimento de fala, o processo é oposto. A entrada vem de um falante humano dizendo palavras em um computador. O computador ouvirá cada palavra e comparará o padrão gerado pela voz do falante com uma biblioteca de possíveis sons e palavras. Em seguida, faz uma determinação da palavra mais provável e a envia para a segunda parte do sistema. Esta parte realmente imprime as palavras na tela, semelhante a como o programa de síntese diz as palavras.

Como todo falante parece um pouco diferente, síntese de fala eOs programas de reconhecimento geralmente têm uma ampla margem de erro. Uma das maneiras pelas quais as pessoas combatem esses erros é através de perfis de fala individualizados. Um único orador terá seu discurso analisado pelo programa para encontrar seus padrões vocais específicos. Quando ele encontra erros na tradução do computador, ele pode corrigi -los especificamente. As correções são analisadas e armazenadas pelo programa, portanto, quando a palavra problemática aparecer novamente, o programa o traduzirá corretamente.

Existe uma ampla aplicação para programas de síntese de fala e reconhecimento. Na área médica, esses programas permitem que as pessoas comuniquem quem, de outra forma, talvez não seja incapaz. Esses programas têm uma ampla aplicação nos negócios como um meio mais rápido de traduzir relatórios e documentos. O reconhecimento de fala também é um método comum de configurar dispositivos sem mãos em automóveis, permitindo que as pessoas conversassem ao telefone com mais segurança enquanto dirigiam.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?