O que é transcrição de áudio?
Transcrição de áudio é o processo de levar palavras faladas e transformá -las em texto escrito. No passado, uma pessoa se sentava e escrevia palavras como eram faladas. Agora, existem gravações de áudio de vários tipos e vários métodos de transcrição. Os métodos de gravação analógica e digital permitirão uma pessoa que não esteja presente durante a conversa ainda transcreva o texto. Além disso, muitos pacotes de software lerão arquivos de áudio e os convertem rapidamente em texto sem precisar reproduzi -los.
Por muitos anos, a transcrição de áudio era uma profissão especializada e tediosa. As pessoas que transcreveram o discurso tinham que estar presentes no momento da fala, muitas vezes o que significa que as empresas teriam que contratar pessoas treinadas em técnicas avançadas, como abreviação. Isso também limitou os serviços de transcrição àqueles que tiveram acesso a um transcritor treinado.
Com a invenção das gravações de áudio, esse campo mudou drasticamente. Com uma gravação, o transcritor poderia funcionar de qualquer lugar onde o rEcording poderia ser entregue. Além disso, a transcrição não precisava mais de abreviação, pois a gravação pode ser revertida e ouvida várias vezes. Um único transcritor também pode funcionar para uma infinidade de clientes simultaneamente, pois ela não precisava mais estar presente para os discursos.
Com o aumento do uso do computador e das velocidades da Internet, o campo da transcrição de áudio permaneceu em grande parte o mesmo. Os arquivos, em vez de fitas, foram frequentemente enviados por e -mail, em vez de serem enviados por correio normal. A velocidade do processo aumentou, mas os métodos não.
Isso mudou no final dos anos 90 com o crescente uso do software de reconhecimento e ditado de fala. O trabalho de transcrever estava indo cada vez mais em relação à assistência ao computador e depois à automação total. Saiu de pacotes de software que poderiam ler as informações dentro de um arquivo de áudio e usar os padrões de ondas do alto -falante para criar uma versão de texto de um Speech. Isso levaria segundos em vez das minutos ou horas de um transcritor humano.
A transcrição de áudio automatizada por computador tem algumas falhas difíceis de superar, a maior das quais é uma relativa falta de fala corretiva. Quando um transcritor humano ouve o texto, ela pode corrigir pequenos erros no discurso para torná -lo mais legível. Embora alguma transcrição seja literal, o que significa que é exatamente o que a pessoa disse, a maioria não é. Sem o discurso corretivo, um humano geralmente terá que verificar a transcrição quanto a erros antes de ser usada.
A outra falha comum da transcrição de áudio baseada em computador está no próprio discurso dos seres humanos. Como as pessoas têm uma enorme variedade de tons e padrões quando falam, a criação de um programa de computador que pode ler e traduzir com precisão todo o intervalo é excepcionalmente difícil. Isso significa que uma certa quantidade de erro é comum em quase todo o software de transcrição. A maneira mais comum de contornar essa falha é através de LO discurso ganhou, onde o programa e um único orador trabalham juntos o suficiente para que o programa se concentre nos padrões da pessoa única.