¿Qué es el robusto reconocimiento de voz?

El reconocimiento de voz robusto puede detectar adecuadamente el habla en condiciones adversas como entornos ruidosos o en grabaciones rascadas. Esto puede tener aplicaciones importantes en varias áreas, como la aplicación de la ley o el diseño de audífonos, por ejemplo. La investigación y el desarrollo de este tema ocurre en instituciones académicas, empresas privadas y organizaciones caritativas interesadas en este campo en todo el mundo. Las carreras en este campo están abiertas para personas como ingenieros de sonido, programadores de computadoras y audiólogos.

El reconocimiento de voz convencional sufre el problema de haber sido diseñado para entornos ideales. Un algoritmo puede reconocer el habla si ocurre en un entorno tranquilo con poco o ningún ruido de fondo, y si el altavoz articula claramente las palabras. Tales programas pueden luchar con los acentos que no han aprendido, y también tienden a descomponerse en entornos con mucho ruido de fondo. El mundo a menudo es ruidoso y, por lo tanto, tal equipopuede ser de uso limitado en algunos entornos sin un reconocimiento de voz robusto.

En dictado, por ejemplo, la mayoría de los sistemas dependen de un micrófono usado cerca de la boca, para permitir que la voz del hablante domine para que el programa pueda procesar con precisión el discurso. El reconocimiento de voz utilizado en aplicaciones como la escucha remota para la aplicación de la ley, el diseño de audífonos y la restauración de grabaciones históricas también pueden tener dificultades con el ruido de fondo. El reconocimiento de voz robusto implica el desarrollo de algoritmos que pueden procesar y descartar este ruido para dejar solo el discurso.

.

Esto requiere habilidades informáticas complejas. Los entornos ruidosos pueden contener una amplia variedad de sonidos, lo que dificulta simplemente crear un filtro de pase que eliminaría una variedad de ruido. Es posible que el filtro no capte todos los ruidos del problema, y ​​también podría interferir con el discurso. En un robusto reconocimiento de voz, ProgLos estamacas trabajan para desarrollar programas que puedan identificar el habla y separarlo de otras pistas de sonido. Una vez separado, puede someterse a otro pase para limpiar la señal, lo que permite que el programa ejecute un algoritmo normal de reconocimiento de voz para determinar lo que se dice.

El reconocimiento preciso de voz puede ser importante para los menús automatizados, el dictado y otras aplicaciones en tiempo real. El desarrollo de un robusto reconocimiento de voz también puede ayudar con la creación de audífonos y software que y identifican las voces humanas en un zumbido de otro ruido, y transmitir solo estos al oyente. Esto hace que el reconocimiento de voz sea más útil en entornos como fiestas abarrotadas y eventos donde pueden competir múltiples sonidos, potencialmente ahogando voces para los oyentes que dependen del reconocimiento de voz.

OTROS IDIOMAS