Skip to main content

Что такое аудио транскрипция?

Аудио транскрипция - это процесс принятия произнесенных слов и превращения их в письменный текст. В прошлом человек сидел и писал слова, как они были сказаны. В настоящее время существуют аудиозаписи различных типов и несколько способов транскрипции. Аналоговые и цифровые методы записи позволят человеку, который не присутствует во время разговора, по-прежнему транскрибировать текст. Кроме того, многие программные пакеты будут считывать аудиофайлы и быстро преобразовывать их в текст без необходимости их воспроизведения.

В течение многих лет аудио транскрипция была специализированной и утомительной профессией. Люди, которые транскрибировали речь, должны были присутствовать во время выступления, часто имея в виду, что компании должны были бы нанимать людей, обученных передовым методам, таким как стенография. Это также ограничивало услуги транскрипции для тех, кто имел доступ к обученному транскриберу.

С изобретением аудиозаписей это поле резко изменилось. С записью транскрибер может работать из любой точки, где запись может быть доставлена. Кроме того, транскрипция больше не нуждалась в сокращении, поскольку запись могла быть полностью изменена и прослушана несколько раз. Один транскрибер также может работать на множество клиентов одновременно, поскольку ей больше не нужно присутствовать на выступлениях.

С ростом использования компьютеров и скорости интернета область транскрипции аудио осталась практически неизменной. Файлы, а не ленты, часто отправлялись по электронной почте, а не отправлялись обычной почтой. Скорость процесса возросла, а методы - нет.

Это изменилось в конце 90-х годов с ростом использования программного обеспечения для распознавания речи и диктовки. Работа по расшифровке переписывалась все больше и больше на компьютерную помощь, а затем на полную автоматизацию. Появились пакеты программного обеспечения, которые могли считывать информацию в аудиофайле и использовать волновые шаблоны говорящего для создания текстовой версии речи. Это займет секунды, а не минуты или часы человеческого транскрибера.

Компьютеризированная автоматическая транскрипция звука имеет несколько недостатков, которые трудно преодолеть, крупнейшим из которых является относительное отсутствие корректирующей речи. Когда человек слушает текст, он может исправить небольшие ошибки в речи, чтобы сделать ее более читабельной. Хотя некоторые транскрипции дословно, то есть это именно то, что сказал человек, большинство не так. Без корректирующей речи человеку часто приходится проверять транскрипцию на наличие ошибок, прежде чем ее использовать.

Другой распространенный недостаток компьютерной транскрипции звука заключается в самой речи людей. Поскольку во время разговора люди обладают огромным диапазоном тонов и моделей, создание компьютерной программы, способной точно считывать и переводить весь диапазон, исключительно сложно. Это означает, что определенное количество ошибок встречается практически во всех программах транскрипции. Наиболее распространенный способ обойти этот недостаток - через научную речь, когда программа и один оратор работают вместе достаточно, чтобы программа сосредоточилась на шаблонах одного человека.