¿Qué es la transcripción automática?
La transcripción automática es el proceso de producir una transcripción escrita de discurso hablado o registrado mediante el uso de computadoras y sin intervención humana directa. La transcripción automática precisa requiere un software de transcripción de alta calidad y un dispositivo que pueda recibir con precisión la entrada auditiva. En general, también es necesario que el discurso o la grabación se transcriba estén razonablemente libres de distorsión e interferencia del ruido de fondo. También se han hecho intentos para transcribir música con el uso de computadoras que ejecutan un software de transcripción especializado. La transcripción musical implica escribir las notas de una pieza musical determinada, particularmente cuando no hay notación preexistente para esa música, como es el caso de los solos improvisados.
El buen software de transcripción es necesario para una transcripción automática exitosa. El software es responsable de procesar la entrada auditiva, separando una secuencia de lenguaje continuo en palabras separadas, reconociendo esas palabras,y representándolos correctamente en el texto. Una falla en cualquier etapa de este proceso generalmente da como resultado una transcripción que difiere algo del material fuente. Un buen software de transcripción automática debería poder reconocer las diferencias sutiles entre palabras similares y compensar varios estilos y velocidades de habla. Los acentos difíciles de entender tienden a ser problemáticos incluso para el mejor software de transcripción.
Algunas personas usan software de transcripción automática porque prefieren el dictado para escribir o escribir directamente su texto. Algunas formas de software de transcripción automática son particularmente buenas para este propósito porque pueden "aprender" las voces de las personas cuyas palabras están transcribiendo. En tales casos, la transcripción automática no se utiliza para crear transcripciones del habla a partir de una variedad de fuentes diferentes, por lo que no es necesario que el software esté abierto a una amplia variedad.de patrones de habla. Permitir este proceso de optimización, que puede ocurrir durante el uso extendido del software por una persona o durante una calibración preliminar, puede aumentar en gran medida la precisión y la potencial velocidad de dictado.
Las computadoras, desafortunadamente, no son tan adecuadas para reconocer de manera consistente y precisa, como lo son los humanos. No pueden, por ejemplo, usar pistas contextuales si no entienden una palabra en particular. Como tal, a menudo es necesario que un humano revise las transcripciones creadas a través de la transcripción automática. Los errores menores en el formato y varios errores en la transcripción son, en muchos casos, comunes a menos que el discurso transcrito sea muy claro. Aún así, el uso de la transcripción computarizada puede hacer rápidamente una base sólida para una transcripción que requiere solo una intervención humana limitada antes de enviar o usar.