O que é mineração de áudio?

A mineração de áudio é geralmente usada em software de reconhecimento de fala e análise musical. Essa tecnologia oferece ao usuário a capacidade de pesquisar através da fala ou do áudio musical que foi analisado para características específicas. Quando usado na tecnologia de reconhecimento de fala, a mineração de áudio identifica palavras faladas no áudio e as coloca em um arquivo pesquisável. Esse recurso pode ser útil para estudantes ou para os negócios do mundo que participam de muitas reuniões porque permite que o usuário navegue com mais facilidade as informações tópicas das apresentações de fala. Esse tipo de análise também pode ser usado em música para determinar características como batidas por minuto (BPM), chave musical e estrutura musical, informações empregadas para classificar a música.

No reconhecimento da fala, onde a tecnologia é mais frequentemente usada, a mineração de áudio é empregada para criar um modelo acústico. Um software de reconhecimento de fala de programas de modelos acústicos para reconhecer os padrões de fala como palavras. Esta tecnologia é desenvolvida pela Audio Mining a RecOrding de uma frase falada, que é comparada ao texto que corresponde à frase falada. O computador usa as informações para reconhecer palavras quando o usuário emitir sons semelhantes aos do modelo acústico. Um modelo acústico é usado em combinação com um arquivo que informa ao programa de reconhecimento de fala que idioma interpretar e quais padrões de palavras provavelmente serão falados em certas frases e situações.

músicos e ouvintes de música podem se beneficiar da mineração de áudio na música. Às vezes, o software musical que categoriza a música do gênero usa mineração de áudio para organizar a música. O processo identifica e agrupa arquivos de música com semelhanças de som que ocorrem frequentemente em gêneros musicais. Embora essa tecnologia possa facilitar a organização da música e a descoberta de novas músicas, ela pode tornar os erros classificando músicas que possuem características medidas semelhantes, mas som geral diferente. Audio analisando SOFO Tware pode ser útil para os músicos, especialmente os compositores, porque permite que o compositor pule para partes específicas da estrutura da música, incluindo mudanças e palavras de chaves musicais na letra.

O fabricante de software de reconhecimento de fala Dragon® vende um programa chamado Audiomining® que transcreve arquivos de áudio e marca os arquivos para que possam ser pesquisados ​​por texto. Dragon é fabricante de programas de lingüística de computadores, o termo técnico do campo de software projetado para interpretar a fala. A mineração de áudio, quando usada como duas palavras, é um termo geral que se refere à análise de um arquivo de som para um conjunto determinado de características de áudio. Outros fabricantes de software de mineração de áudio incluem Nuance® e Nexidia®.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?