O que é reconhecimento de voz?

O reconhecimento de voz pode se referir a um dos dois tipos de ciência da computação: identificação forense de voz ou capacidade de fala para texto. Este artigo aborda a última definição. Falar em um microfone, por exemplo, produz o mesmo resultado que digitar palavras manualmente com um teclado. Simplificando, o software de reconhecimento de voz foi projetado com um banco de dados interno de palavras ou frases reconhecíveis. O programa corresponde à assinatura de discurso de áudio com as entradas correspondentes no banco de dados.

Embora transformar a fala em texto possa parecer fácil, é uma tarefa extremamente difícil. O problema está na gama praticamente infinita de padrões e sotaques individuais de fala, composta pela tendência humana natural de executar palavras juntas.

Uma ilustração dos desafios inerentes ao software de reconhecimento de voz aparece em uma camiseta Creatos por pesquisadores da Apple. A camisa diz: "Ajudei a Apple a destruir uma bela praia". Quando falado em voz alta, parece que, , ajudei a Apple a reconhecer a fala. Cada modelo se comporta de maneira diferente e tem suas próprias capacidades e limites.

Programas de reconhecimento de voz que exigem que o usuário "treine" o software para reconhecer seus padrões estilizados específicos de fala são chamados de sistemas dependentes do alto -falante . Os indivíduos geralmente usam esses tipos de programas em casa ou no escritório. Email, memorandos, cartas, dados e texto podem ser inseridos falando em um microfone.

Alguns sistemas de reconhecimento de voz, chamados de sistemas discretos de fala , exigem que o usuário fale claramente e shumildemente e para separar palavras. Sistemas de fala contínua são projetados para entender um modo mais natural de falar.

Os sistemas de reconhecimento de voz discretos de fala são amplamente utilizados para o roteamento de atendimento ao cliente. O sistema é independente do alto -falante , mas entende apenas um pequeno pool de palavras ou frases. O chamador tem a opção de responder a uma pergunta, geralmente com "sim" ou "não". Depois de receber uma resposta, o sistema aumenta o chamador para o próximo nível. Se o chamador responder com uma resposta única, a resposta automatizada geralmente será: "Desculpe, eu não entendi você; tente novamente", com a repetição da pergunta e as respostas disponíveis. Esse tipo de reconhecimento de voz também é chamado de reconhecimento de gramática.

A fala contínua é uma forma mais sofisticada de software de reconhecimento de voz, na qual o chamador pode falar naturalmente para explicar um problema ou solicitar um serviço. Este programa foi projetado para escolher palavras -chave ou frases e fazer uma estatísticaA melhor adivinhação é o que o cliente deseja. Falar claramente ajuda o reconhecimento de voz na identificação da necessidade. Esse tipo de sistema possui um banco de dados muito mais intensivo do que os discretos sistemas de fala e também é chamado de reconhecimento de linguagem natural.

O reconhecimento automático de fala (ASR) é um modelo de reconhecimento de voz projetado para o ditado. Este software difere dos modelos anteriores, pois não se esforça para entender o que está sendo dito, apenas para identificar as palavras faladas. Como muitas palavras no idioma inglês parecem iguais, os erros são cometidos facilmente. No entanto, grandes empresas como a Microsoft estão investindo em reconhecimento de voz, e a própria previsão de Bill Gates tem o ASR compreendendo o discurso contínuo até o ano de 2011. O software ASR é frequentemente encontrado em gravadores de voz digital.

Players dominantes no software de reconhecimento de voz foram Scanftof e nuances, com a antiga empresa adquirindo o último. Jogadores menores incluem discurso de fonix, aculab e verbio, entreOutros, com grandes empresas como a IBM e a Microsoft acima mencionada também investindo na tecnologia. Embora muitos ainda achem mais difícil treinar software e corrigir erros do que simplesmente usar um teclado, está chegando um tempo quando o software de reconhecimento de voz provavelmente fechará essa lacuna. Aumentar os teclados com a capacidade discriminada de usar a fala provavelmente se tornará comum.

O software de reconhecimento de voz está ganhando popularidade à medida que se torna mais sofisticado. É especialmente útil nos negócios, onde pode substituir um operador ao vivo para canalizar chamadas, disseminar informações, receber pedidos e desempenhar outras funções altamente úteis. No entanto, também está ganhando favor como um aplicativo de desktop, ajudado por software renomado como o Scansoft's, dragonnaturlyspeary e IBM's viavoice .

O que é reconhecimento de voz?

OUTRAS LÍNGUAS

ARTIGOS RELACIONADOS

Como podemos ajudar?