Co to jest transkrypcja audio?

Transkrypcja audio to proces przyjmowania wypowiedzianych słów i przekształcania ich w tekst pisany. W przeszłości osoba siedziała i pisała słowa podczas ich wypowiadania. Teraz istnieją nagrania audio różnych typów i kilka metod transkrypcji. Metody nagrywania analogowego i cyfrowego pozwolą osobie, która nie jest obecna podczas rozmowy, aby nadal transkrybować tekst. Ponadto wiele pakietów oprogramowania odczytuje pliki audio i szybko przekonwertuje je na tekst bez konieczności ich odtwarzania.

Przez wiele lat transkrypcja audio była specjalistycznym i żmudnym zawodem. Ludzie, którzy przepisali mowę, musieli być obecne w momencie mówienia, często oznacza, że firmy musiałyby zatrudnić osoby przeszkolone w zakresie zaawansowanych technik, takich jak skrót. Ograniczono to również usługi transkrypcyjne dla osób, które miały dostęp do wyszkolonego transkrybenta.

Wraz z wynalezieniem nagrań audio to pole zmieniło się dramatycznie. Z nagraniem, transkrybent może działać z dowolnego miejsca, w którym rEcording można dostarczyć. Ponadto transkrypcja nie wymagała już skrótów, ponieważ nagranie można było odwrócić i wysłuchać wiele razy. Pojedynczy transkrybent może również działać jednocześnie dla wielu klientów, ponieważ nie musiała już być obecna dla przemówień.

Wraz ze wzrostem korzystania z komputera i prędkości Internetu pole transkrypcji audio pozostało w dużej mierze tak samo. Pliki, a nie taśmy, były często wysyłane e -mailem zamiast wysyłania normalnej poczty. Szybkość procesu wzrosła, ale metody nie.

Zmieniło się to pod koniec lat 90. wraz z rosnącym wykorzystaniem oprogramowania do rozpoznawania mowy i dyktowania. Zadaniem transkrypcji było coraz więcej w kierunku pomocy komputerowej, a następnie pełnej automatyzacji. Pojawiły się pakiety oprogramowania, które mogły odczytać informacje w pliku audio i użyć wzorców fal głośnika do zbudowania wersji tekstowej SPEECH. Zajmie to kilka sekund niż minuty lub godziny ludzkiego transkrybera.

Transkrypcja audio komputerowa ma kilka wad, które są trudne do pokonania, z których największym jest względny brak mowy naprawczej. Gdy ludzki transkrybent słucha tekstu, może naprawić niewielkie błędy w mowie, aby uczynić go bardziej czytelnym. Chociaż pewna transkrypcja jest dosłownie, co oznacza, że jest to dokładnie to, co powiedziała osoba, większość nie jest. Bez mowy naprawczej człowiek często będzie musiał sprawdzić transkrypcję błędów przed jego użyciem.

Inna wspólna wada komputerowej transkrypcji audio leży w samej mowie ludzi. Ponieważ ludzie mają szeroki zakres tonów i wzorów, gdy mówią, tworzenie programu komputerowego, który może dokładnie odczytać i przetłumaczyć cały zakres, jest wyjątkowo trudne. Oznacza to, że pewna ilość błędu jest powszechna w prawie całym oprogramowaniu transkrypcyjnym. Najczęstszym sposobem pracy wokół tej wady jest LZdobył przemówienie, w którym program i jeden głośnik współpracują na tyle, aby program koncentrował się na wzorcach pojedynczej osoby.

Co to jest transkrypcja audio?

INNE JĘZYKI