O que é um modelo acústico?

Um modelo acústico é essencialmente um mapa da voz em relação a uma série de palavras impressas. Essa tecnologia é usada em programas de reconhecimento de fala para ajudar um computador a aprender a reconhecer os padrões de fala de uma pessoa. Um modelo acústico é um dos dois arquivos principais necessários para executar um programa de reconhecimento de fala; o outro é o modelo de linguagem, que indica prováveis ​​palavras e padrões de fala que podem ser usados ​​pelo falante. Esses modelos são criados comparando os detalhes do som de um arquivo de áudio falado com o texto das palavras faladas.

O software de reconhecimento de fala é um software projetado para reconhecer e transcrever ou responder às palavras que uma pessoa diz. Muitos sistemas operacionais são projetados com recursos básicos de reconhecimento de fala embutidos que o usuário pode ativar e desativar. Os recursos de reconhecimento de fala nos sistemas operacionais geralmente dão ao usuário a capacidade de controlar o computador e digitar palavras na tela usando sua voz.

Para acessar o software de reconhecimento de fala, o usuário precisa de um microfone para obter sua voz no computador, além de um programa que processa o som. Enquanto muitos computadores possuem microfones embutidos, um microfone de headset externo permite ao usuário o benefício de um som de voz mais claro e a liberdade de se movimentar pela sala enquanto fala. Marcas de software de reconhecimento de fala independentes incluem LumenVox®, Loquendo® e Dragon®.

A maioria dos programas de reconhecimento de fala possui programação de modelo acústico que permite ao programa reconhecer variações na pronúncia. Eles usam padrões no som da voz do falante para identificar as palavras na fala. Muitos são projetados com software de configuração feito para ajudar o usuário a criar um modelo acústico projetado para interpretar sua própria voz. Alguns programas avançados de reconhecimento de fala podem identificar e interpretar vários idiomas, geralmente com uma pequena quantidade de informações sonoras. Quanto mais avançado for um programa de reconhecimento de fala, maior a probabilidade de interpretar com precisão as palavras com base em seu contexto, incluindo o local em que uma frase é dita.

O campo de estudo que desenvolve a tecnologia de reconhecimento de fala é chamado linguística computacional. Linguística computacional envolve estudo e design que cria software programado para entender a fala humana. Esse campo geralmente incorpora informações do estudo da psicologia para criar modelos acústicos que podem interpretar com mais precisão a fala.

A palavra "acústico" geralmente se refere a qualquer coisa que tenha a ver com som. Embora os modelos acústicos sejam usados ​​com mais freqüência no reconhecimento de fala, eles também podem ser usados ​​na música. Um modelo acústico de uma faixa de música pode identificar propriedades como batidas por minuto, teclas musicais ou tons dominantes na música. Essas informações podem ser usadas por um programa de computador para identificar uma faixa de música ou para determinar livremente o gênero em que a música provavelmente está categorizada. Modelos acústicos também são usados ​​em um campo de estudo chamado psicoacústica, no qual os pesquisadores esperam aprender a estruturar músicas que afetem previsivelmente o cérebro.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?