Co je přepis zvuku?
Přepis zvuku je proces přijímání mluvených slov a jejich přeměny na psaný text. V minulosti člověk seděl a psal slova, jak byla řečena. Nyní existují zvukové nahrávky různých typů a několik způsobů transkripce. Analogové a digitální metody záznamu umožní osobě, která není během hovoru, přepisovat text. Kromě toho bude mnoho softwarových balíčků číst zvukové soubory a rychle je převést na text, aniž by je muselo skutečně přehrávat.
Po mnoho let byla zvuková transkripce specializovanou a zdlouhavou profesí. Lidé, kteří přepisovali řeč, museli být přítomni v době mluvení, což často znamená, že společnosti by musely najmout lidi vyškolené v pokročilých technikách, jako je zkratka. To také omezilo transkripční služby na ty, kteří měli přístup k vyškolenému přepisovateli.
S vynálezem zvukových záznamů se toto pole dramaticky změnilo. Pomocí záznamu mohl přepisovatel pracovat odkudkoli, kde mohl být záznam doručen. Kromě toho již transkripce nepotřebovala zkratku, protože nahrávání bylo možné obrátit a poslouchat několikrát. Jeden přepisovatel by také mohl pracovat pro velké množství klientů současně, protože pro projevy již nepotřebovala být přítomna.
S rostoucím používáním počítače a rychlostí internetu zůstalo pole přepisu zvuku téměř stejné. Soubory, spíše než pásky, byly často odesílány e-mailem namísto odesílání běžnou poštou. Rychlost procesu se zvýšila, ale metody ne.
To se změnilo na konci 90. let s rostoucím používáním softwaru pro rozpoznávání řeči a diktování. Úkolem přepisování bylo stále více směřovat k počítačové asistenci a poté k plné automatizaci. Objevily se softwarové balíčky, které dokázaly přečíst informace uvnitř zvukového souboru a pomocí vlnových vzorů mluvčího vytvořit textovou verzi řeči. Trvalo by to několik sekund než minut nebo hodin lidského transkripce.
Počítačem automatizovaný přepis zvuku má několik nedostatků, které je obtížné překonat, z nichž největší je relativní nedostatek opravné řeči. Když lidský přepisovatel poslouchá text, může napravit drobné chyby v řeči, aby byl lépe čitelný. Zatímco některá transkripce je doslovně, což znamená, že to je přesně to, co osoba řekla, většina není. Bez korektivní řeči bude muset člověk před používáním zkontrolovat, zda nedošlo k chybám v přepisu.
Další běžná chyba počítačové transkripce zvuku spočívá v samotné řeči člověka. Protože lidé mají při mluvení obrovskou škálu tónů a vzorů, je vytvoření počítačového programu, který dokáže přesně číst a překládat celý rozsah, mimořádně obtížné. To znamená, že určité množství chyb je běžné téměř ve všech transkripčních programech. Nejběžnějším způsobem, jak tuto chybu obejít, je prostřednictvím naučené řeči, kde program a jediný reproduktor spolupracují natolik, že se program zaměřuje na vzorce jediného člověka.