Co to jest transkrypcja audio?

Transkrypcja audio to proces przyjmowania wypowiedzianych słów i przekształcania ich w tekst pisany. W przeszłości osoba siedziała i pisała słowa podczas ich wypowiadania. Teraz istnieją nagrania audio różnych typów i kilka metod transkrypcji. Metody nagrywania analogowego i cyfrowego pozwolą osobie, która nie jest obecna podczas rozmowy, aby nadal transkrybować tekst. Ponadto wiele pakietów oprogramowania odczytuje pliki audio i szybko przekonwertuje je na tekst bez konieczności ich odtwarzania.

Przez wiele lat transkrypcja audio była specjalistycznym i żmudnym zawodem. Ludzie, którzy przepisali mowę, musieli być obecne w momencie mówienia, często oznacza, że ​​firmy musiałyby zatrudnić osoby przeszkolone w zakresie zaawansowanych technik, takich jak skrót. Ograniczono to również usługi transkrypcyjne dla osób, które miały dostęp do wyszkolonego transkrybenta.

Wraz z wynalezieniem nagrań audio to pole zmieniło się dramatycznie. Z nagraniem, transkrybent może działać z dowolnego miejsca, w którym rEcording można dostarczyć. Ponadto transkrypcja nie wymagała już skrótów, ponieważ nagranie można było odwrócić i wysłuchać wiele razy. Pojedynczy transkrybent może również działać jednocześnie dla wielu klientów, ponieważ nie musiała już być obecna dla przemówień.

Wraz ze wzrostem korzystania z komputera i prędkości Internetu pole transkrypcji audio pozostało w dużej mierze tak samo. Pliki, a nie taśmy, były często wysyłane e -mailem zamiast wysyłania normalnej poczty. Szybkość procesu wzrosła, ale metody nie.

Zmieniło się to pod koniec lat 90. wraz z rosnącym wykorzystaniem oprogramowania do rozpoznawania mowy i dyktowania. Zadaniem transkrypcji było coraz więcej w kierunku pomocy komputerowej, a następnie pełnej automatyzacji. Pojawiły się pakiety oprogramowania, które mogły odczytać informacje w pliku audio i użyć wzorców fal głośnika do zbudowania wersji tekstowej SPEECH. Zajmie to kilka sekund niż minuty lub godziny ludzkiego transkrybera.

Transkrypcja audio komputerowa ma kilka wad, które są trudne do pokonania, z których największym jest względny brak mowy naprawczej. Gdy ludzki transkrybent słucha tekstu, może naprawić niewielkie błędy w mowie, aby uczynić go bardziej czytelnym. Chociaż pewna transkrypcja jest dosłownie, co oznacza, że ​​jest to dokładnie to, co powiedziała osoba, większość nie jest. Bez mowy naprawczej człowiek często będzie musiał sprawdzić transkrypcję błędów przed jego użyciem.

Inna wspólna wada komputerowej transkrypcji audio leży w samej mowie ludzi. Ponieważ ludzie mają szeroki zakres tonów i wzorów, gdy mówią, tworzenie programu komputerowego, który może dokładnie odczytać i przetłumaczyć cały zakres, jest wyjątkowo trudne. Oznacza to, że pewna ilość błędu jest powszechna w prawie całym oprogramowaniu transkrypcyjnym. Najczęstszym sposobem pracy wokół tej wady jest LZdobył przemówienie, w którym program i jeden głośnik współpracują na tyle, aby program koncentrował się na wzorcach pojedynczej osoby.

INNE JĘZYKI