¿Qué es un modelo acústico?
Un modelo acústico es esencialmente un mapa de la voz en relación con una serie de palabras impresas. Esta tecnología se utiliza en los programas de reconocimiento de voz para ayudar a una computadora a aprender a reconocer los patrones de voz de una persona. Un modelo acústico es uno de los dos archivos principales necesarios para ejecutar un programa de reconocimiento de voz; El otro es el modelo de idioma, que indica probables palabras y patrones de voz que el hablante puede usar. Estos modelos se crean comparando los detalles de sonido de un archivo de audio hablado con el texto de las palabras habladas.
El software de reconocimiento de voz es un software diseñado para reconocer y transcribir o responder a las palabras que dice una persona. Muchos sistemas operativos están diseñados con capacidades de reconocimiento de voz básicas incorporadas que el usuario puede activar y apagar. Las capacidades de reconocimiento de voz en los sistemas operativos generalmente le dan al usuario la capacidad de controlar la computadora y escribir palabras en la pantalla usando su voz.
Para acceder al software de reconocimiento de voz, un usuario necesita unMicrófono para llevar su voz a la computadora, además de un programa que procesa el sonido. Si bien muchas computadoras tienen micrófonos incorporados, un micrófono externo auricular le permite al usuario el beneficio del sonido de voz más claro y la libertad de moverse por la habitación mientras habla. Las marcas independientes de software de reconocimiento de voz incluyen Lumenvox®, Loquendo® y Dragon®.
La mayoría de los programas de reconocimiento de voz tienen una programación de modelo acústico que permite al programa reconocer variaciones en la pronunciación. Usan patrones en el sonido de la voz del hablante para identificar palabras en el habla. Muchos están diseñados con software de configuración hecho para ayudar al usuario a crear un modelo acústico diseñado para interpretar su propia voz. Algunos programas avanzados de reconocimiento de voz pueden identificar e interpretar múltiples idiomas, a menudo con una pequeña cantidad de información sólida. Cuanto más avanzado es un programa de reconocimiento de voz, más liKely es interpretar con precisión las palabras basadas en su contexto, incluso en el que en una oración se habla una palabra.
El campo de estudio que desarrolla tecnología de reconocimiento de voz se llama lingüística computacional. La lingüística computacional implica estudio y diseño que crea software programado para comprender el habla humana. Este campo a menudo incorpora información del estudio de la psicología para crear modelos acústicos que puedan interpretar con mayor precisión el habla.
La palabra "acústica" generalmente se refiere a cualquier cosa que tenga que ver con el sonido. Aunque los modelos acústicos se usan con mayor frecuencia en el reconocimiento de voz, también se pueden usar en la música. Un modelo acústico de una pista de música puede identificar propiedades como ritmos por minuto, las claves musicales o lanzamientos dominantes en la música. Esta información puede ser utilizada por un programa de computadora para identificar una pista de música, o puede usarse para determinar libremente el género en el que probablemente se clasifique la música. Los modelos acústicos también se utilizan en un campo deEstudio llamado psicoacústica, en el que los investigadores esperan aprender a estructurar música que afecte previsiblemente el cerebro.