Co to jest transkrypcja audio?
Transkrypcja audio polega na przyjmowaniu wypowiadanych słów i przekształcaniu ich w tekst pisany. W przeszłości człowiek siedział i pisał słowa tak, jak zostały wypowiedziane. Obecnie istnieją nagrania audio różnych typów i kilka metod transkrypcji. Analogowe i cyfrowe metody nagrywania pozwolą osobie nieobecnej podczas rozmowy na transkrypcję tekstu. Ponadto wiele pakietów oprogramowania odczytuje pliki audio i szybko konwertuje je na tekst bez konieczności ich odtwarzania.
Przez wiele lat transkrypcja audio była specjalistycznym i żmudnym zawodem. Ludzie, którzy przepisywali mowę, musieli być obecni podczas mówienia, co często oznaczało, że firmy musiałyby zatrudniać osoby przeszkolone w zaawansowanych technikach, takich jak stenografia. Ograniczało to również usługi transkrypcyjne do tych, którzy mieli dostęp do wyszkolonego transkrypcji.
Wraz z wynalezieniem nagrań audio pole to zmieniło się diametralnie. Dzięki nagraniu transkrybent może pracować z dowolnego miejsca, w którym nagranie może zostać dostarczone. Ponadto transkrypcja nie była już potrzebna, ponieważ nagranie można było odwrócić i wysłuchać wiele razy. Pojedynczy abonent może również pracować dla wielu klientów jednocześnie, ponieważ nie musi już być obecna podczas przemówień.
Wraz ze wzrostem wykorzystania komputera i prędkości Internetu dziedzina transkrypcji dźwięku pozostała w dużej mierze taka sama. Pliki, a nie taśmy, były często wysyłane pocztą e-mail zamiast zwykłej poczty. Szybkość procesu wzrosła, ale metody nie.
Zmieniło się to pod koniec lat 90. wraz z rosnącym wykorzystaniem oprogramowania do rozpoznawania mowy i dyktowania. Zadaniem transkrypcji było coraz więcej w kierunku pomocy komputerowej, a następnie pełnej automatyzacji. Pojawiły się pakiety oprogramowania, które mogły odczytać informacje zawarte w pliku audio i wykorzystać wzorce falowe głośnika do zbudowania tekstowej wersji mowy. Zajmie to sekundy, a nie minuty lub godziny ludzkiego transkrypcji.
Komputerowo zautomatyzowana transkrypcja audio ma kilka wad, które są trudne do przezwyciężenia, z których największym jest względny brak mowy korygującej. Gdy człowiek transkrybujący słucha tekstu, może poprawić niewielkie błędy w mowie, aby uczynić ją bardziej czytelną. Chociaż niektóre transkrypcje są dosłowne, co oznacza, że jest dokładnie tym, co powiedziała osoba, większość nie. Bez mowy korygującej człowiek często będzie musiał sprawdzić transkrypcję pod kątem błędów przed jej użyciem.
Inną powszechną wadą komputerowej transkrypcji audio jest sama mowa ludzi. Ponieważ ludzie mają ogromną różnorodność tonów i wzorów podczas mówienia, stworzenie programu komputerowego, który potrafi dokładnie odczytać i przetłumaczyć cały zakres, jest wyjątkowo trudne. Oznacza to, że pewna ilość błędów jest powszechna w prawie wszystkich programach do transkrypcji. Najczęstszym sposobem obejścia tej wady jest wyuczona mowa, w której program i pojedynczy głośnik współpracują ze sobą na tyle, że program koncentruje się na wzorcach jednej osoby.