¿Qué es la transcripción de audio?

La transcripción de audio es el proceso de tomar palabras habladas y convertirlas en texto escrito. En el pasado, una persona se sentaba y escribía palabras mientras se hablaba. Ahora, existen grabaciones de audio de varios tipos y varios métodos de transcripción. Los métodos de grabación analógicos y digitales permitirán a una persona que no está presente durante la conversación para que todavía transcriba el texto. Además, muchos paquetes de software leerán archivos de audio y los convertirán rápidamente en mensajes de texto sin tener que reproducirlos.

durante muchos años, la transcripción de audio fue una profesión especializada y tediosa. Las personas que transcribieron el discurso tenían que estar presentes al momento de hablar, a menudo lo que significa que las empresas tendrían que contratar personas capacitadas en técnicas avanzadas como la taquigrafía. Esto también limitó los servicios de transcripción a aquellos que tuvieron acceso a un transcriptor capacitado.

Con la invención de las grabaciones de audio, este campo cambió drásticamente. Con una grabación, el transcriptor podría funcionar desde cualquier lugar donde el RSe podría entregar ecording. Además, la transcripción ya no se necesitaba abreviatura, ya que la grabación podría revertirse y escuchar varias veces. Un solo transcriptor también podría funcionar para una multitud de clientes simultáneamente, ya que ya no necesitaba estar presente para los discursos.

Con el aumento en el uso de la computadora y las velocidades de Internet, el campo de la transcripción de audio se mantuvo en gran medida igual. Los archivos, en lugar de las cintas, a menudo se envían por correo electrónico en lugar de ser enviados por correo normal. La velocidad del proceso aumentó, pero los métodos no.

Esto cambió a fines de los 90 con el uso creciente del software de reconocimiento de voz y dictado. El trabajo de la transcripción era ir cada vez más hacia la asistencia informática y luego la automatización completa. Salieron paquetes de software que podrían leer la información dentro de un archivo de audio y usar los patrones de onda del altavoz para crear una versión de texto de un SPEECh. Esto tomaría segundos en lugar de los minutos o las horas de un transcriptor humano.

La transcripción de audio automatizada por computadora tiene algunos defectos que son difíciles de superar, el más grande de los cuales es una falta relativa de discurso correctivo. Cuando un transcriptor humano escucha un texto, puede corregir leves errores en el discurso para que sea más legible. Si bien alguna transcripción es literal, lo que significa que es exactamente lo que dijo la persona, la mayoría no lo es. Sin un discurso correctivo, un humano a menudo tendrá que verificar la transcripción en busca de errores antes de que se use.

El otro defecto común de la transcripción de audio basada en computadora se encuentra en el mismo habla de los humanos. Dado que las personas tienen una amplia gama de tonos y patrones cuando hablan, crear un programa de computadora que pueda leer y traducir con precisión toda la gama es excepcionalmente difícil. Esto significa que una cierta cantidad de error es común en casi todo el software de transcripción. La forma más común de trabajar en este defecto es a través de LDiscurso ganado, donde el programa y un solo orador trabajan juntos lo suficiente como para que el programa se centre en los patrones de la sola persona.

OTROS IDIOMAS