¿Qué es la minería de audio?

La minería de audio generalmente se usa en el software de reconocimiento de voz y el análisis de música. Esta tecnología le da al usuario la capacidad de buscar en audio de voz o música que se haya analizado para obtener características específicas. Cuando se usa en la tecnología de reconocimiento de voz, la minería de audio identifica las palabras habladas en el audio y las coloca en un archivo de búsqueda. Esta característica puede ser útil para los estudiantes o aquellos en el mundo de los negocios que asisten a muchas reuniones porque permite al usuario navegar más fácilmente por la información tópica de las presentaciones del habla. Este tipo de análisis también se puede usar en la música para determinar características como ritmos por minuto (BPM), clave musical y estructura musical, información que se emplea para clasificar la música.

En el reconocimiento de voz, donde la tecnología se usa con mayor frecuencia, la minería de audio se emplea para crear un modelo acústico. Un modelo acústico programa software de reconocimiento de voz para reconocer los patrones de voz como palabras. Esta tecnología es desarrollada por Audio Mining A Rec.Ording de una frase hablada, que se compara con el texto que coincide con la frase hablada. La computadora usa la información para reconocer las palabras cuando el usuario hace sonidos similares a los del modelo acústico. Se utiliza un modelo acústico en combinación con un archivo que le dice al programa de reconocimiento de voz qué lenguaje interpretar y qué patrones de palabras probablemente se hablan en ciertas oraciones y situaciones.

Los músicos y los oyentes de la música pueden beneficiarse de la minería de audio en la música. A veces, el software de música que clasifica la música por género utiliza la minería de audio para organizar la música. El proceso identifica y agrupa archivos de música con similitudes sólidas que ocurren con frecuencia en los géneros musicales. Aunque esta tecnología puede facilitar la organización de la música y encontrar nueva música, puede facilitar los errores de clasificación de canciones que tienen características medidas similares pero un sonido general diferente. Audio Análisis SOFTwee puede ser útil para los músicos, especialmente los compositores, porque permite al compositor saltar a partes específicas de la estructura de la canción, incluidos los cambios y palabras de clave musical dentro de la letra.

El fabricante de software de reconocimiento de voz Dragon® vende un programa llamado Audiomining® que transcribe archivos de audio y marca los archivos para que puedan buscar texto. Dragon es un fabricante de programas de lingüística informática, el término técnico para el campo del software diseñado para interpretar el habla. La minería de audio, cuando se usa como dos palabras, es un término general que se refiere a analizar un archivo de sonido para un conjunto determinado de características de audio. Otros fabricantes de software de minería de audio incluyen Nuance® y Nexidia®.

¿Qué es la minería de audio?

OTROS IDIOMAS