O que é um modelo acústico?

Um modelo acústico é essencialmente um mapa da voz em relação a uma série de palavras impressas. Essa tecnologia é usada em programas de reconhecimento de fala para ajudar um computador a aprender a reconhecer os padrões de fala de uma pessoa. Um modelo acústico é um dos dois arquivos principais necessários para executar um programa de reconhecimento de fala; O outro é o modelo de idioma, que indica palavras prováveis ​​e padrões de fala que podem ser usados ​​pelo falante. Esses modelos são criados comparando os detalhes sonoros de um arquivo de áudio falado com o texto das palavras faladas. Muitos sistemas operacionais são projetados com recursos de reconhecimento básico de fala embutidos que o usuário pode ativar e desligar. Recursos de reconhecimento de fala nos sistemas operacionais geralmente dão ao usuário a capacidade de controlar o computador e digitar palavras na tela usando sua voz.

Para acessar o software de reconhecimento de fala, um usuário precisa de umO microfone para levar a voz ao computador, além de um programa que processa o som. Enquanto muitos computadores possuem microfones embutidos, um microfone externo de fone de ouvido permite ao usuário o benefício do som de voz mais claro e a liberdade de se movimentar pela sala enquanto fala. As marcas de software de reconhecimento de fala independentes incluem Lumenvox®, Loquendo® e Dragon®.

A maioria dos programas de reconhecimento de fala possui programação de modelo acústico que permite ao programa reconhecer variações na pronúncia. Eles usam padrões no som da voz do falante para identificar palavras na fala. Muitos foram projetados com o software de configuração feito para ajudar o usuário a criar um modelo acústico projetado para interpretar sua própria voz. Alguns programas avançados de reconhecimento de fala podem identificar e interpretar vários idiomas, geralmente com uma pequena quantidade de informações sólidas. Quanto mais avançado um programa de reconhecimento de fala, mais liKely é interpretar com precisão as palavras com base em seu contexto, incluindo onde em uma frase uma palavra é falada.

O campo de estudo que desenvolve a tecnologia de reconhecimento de fala é chamado de linguística computacional. A linguística computacional envolve estudo e design que cria software programado para entender a fala humana. Esse campo geralmente incorpora informações do estudo da psicologia para criar modelos acústicos que podem interpretar com mais precisão a fala.

A palavra "acústica" geralmente se refere a qualquer coisa que tenha a ver com som. Embora os modelos acústicos sejam usados ​​com mais frequência no reconhecimento da fala, eles também podem ser usados ​​na música. Um modelo acústico de uma faixa musical pode identificar propriedades como batidas por minuto, as chaves musicais ou arremessos dominantes na música. Essas informações podem ser usadas por um programa de computador para identificar uma faixa de música, ou podem ser usadas para determinar livremente o gênero no qual a música provavelmente é categorizada. Modelos acústicos também são usados ​​em um campo deEstudo chamado Psychoacoustics, no qual os pesquisadores esperam aprender a estruturar a música que afeta previsivelmente o cérebro.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?