Skip to main content

O que é mineração de áudio?

A mineração de áudio é geralmente usada em software de reconhecimento de fala e análise de música. Essa tecnologia oferece ao usuário a capacidade de pesquisar por áudio de fala ou música que foi analisado por características específicas. Quando usada na tecnologia de reconhecimento de fala, a mineração de áudio identifica as palavras faladas no áudio e as coloca em um arquivo pesquisável. Esse recurso pode ser útil para estudantes ou pessoas do mundo dos negócios que participam de muitas reuniões porque permite que o usuário navegue com mais facilidade pelas informações tópicas das apresentações de fala. Esse tipo de análise também pode ser usado na música para determinar características como batimentos por minuto (BPM), chave musical e estrutura musical, informações que são empregadas para classificar a música.

No reconhecimento de fala, onde a tecnologia é mais usada, a mineração de áudio é empregada para criar um modelo acústico. Um modelo acústico programa software de reconhecimento de fala para reconhecer padrões de fala como palavras. Essa tecnologia é desenvolvida pela mineração de áudio, uma gravação de uma frase falada, que é comparada ao texto correspondente à frase falada. O computador usa as informações para reconhecer palavras quando o usuário emite sons semelhantes aos do modelo acústico. Um modelo acústico é usado em combinação com um arquivo que informa ao programa de reconhecimento de fala qual idioma interpretar e quais padrões de palavras provavelmente serão falados em determinadas frases e situações.

Músicos e ouvintes de música podem se beneficiar da mineração de áudio na música. Às vezes, o software de música que categoriza a música por gênero usa a mineração de áudio para organizar a música. O processo identifica e agrupa arquivos de música com semelhanças sonoras que ocorrem com freqüência em gêneros musicais. Embora essa tecnologia possa facilitar a organização de músicas e encontrar novas músicas, ela pode cometer erros ao classificar músicas com características de medição semelhantes, mas com um som geral diferente. O software de análise de áudio pode ser útil para músicos, especialmente compositores, porque permite que o compositor pule para partes específicas da estrutura da música, incluindo alterações de teclas musicais e palavras nas letras.

O fabricante do software de reconhecimento de fala Dragon® vende um programa chamado AudioMining® que transcreve arquivos de áudio e marca os arquivos para que possam ser pesquisados ​​por texto. Dragon é um fabricante de programas de linguística de computador, o termo técnico para o campo de software projetado para interpretar a fala. A mineração de áudio, quando usada como duas palavras, é um termo geral que se refere à análise de um arquivo de som para um conjunto determinado de características de áudio. Outros fabricantes de software de mineração de áudio incluem Nuance® e Nexidia®.