O que é transcrição automática?
Transcrição automática é o processo de produção de uma transcrição escrita de discurso falado ou registrado através do uso de computadores e sem intervenção humana direta. A transcrição automática precisa requer software de transcrição de alta qualidade e um dispositivo que possa receber com precisão a entrada auditiva. Em geral, também é necessário que a fala ou a gravação a ser transcrito esteja razoavelmente livre de distorção e interferência do ruído de fundo. Também foram feitas tentativas para transcrever músicas com o uso de computadores executando software de transcrição especializado. A transcrição musical envolve escrever as notas de uma determinada peça musical, principalmente quando não há notação preexistente para essa música, como é o caso de solos improvisados.
Um bom software de transcrição é necessário para uma transcrição automática bem -sucedida. O software é responsável pelo processamento da entrada auditiva, separando um fluxo de linguagem contínua em palavras separadas, reconhecendo essas palavras,e representando corretamente -os no texto. Uma falha em qualquer estágio desse processo geralmente resulta em uma transcrição que difere um pouco do material de origem. Um bom software de transcrição automática deve ser capaz de reconhecer as diferenças sutis entre palavras semelhantes e compensar vários estilos e velocidades de fala. Os sotaques difíceis de entender tendem a ser problemáticos, mesmo para o melhor software de transcrição.
Algumas pessoas usam o software de transcrição automática porque preferem ditar digitar diretamente ou escrever seu texto. Algumas formas de software de transcrição automática são particularmente boas para esse fim, porque podem "aprender" as vozes das pessoas cujas palavras estão transcrevendo. Nesses casos, a transcrição automática não é usada para criar transcrições de fala a partir de uma variedade de fontes diferentes; portanto, não há necessidade de que o software seja aberto a uma ampla variedadede padrões de fala. Permitir esse processo de otimização, que pode ocorrer durante o uso prolongado do software por uma pessoa ou durante uma calibração preliminar, pode aumentar bastante a precisão e a velocidade potencial do ditado.
Infelizmente, os computadores não são tão adequados para reconhecer de forma consistente e precisa o discurso humano como os humanos. Eles não podem, por exemplo, usar pistas contextuais se não conseguirem entender uma palavra específica. Como tal, geralmente é necessário que um humano revise as transcrições criadas através da transcrição automática. Pequenos erros de formatação e vários erros na transcrição são, em muitos casos, comuns, a menos que a fala transcrita seja muito clara. Ainda assim, o uso de transcrição computadorizada pode rapidamente fazer uma base sólida para uma transcrição que requer apenas intervenção humana limitada antes do envio ou uso.