Hva er lydtranskripsjon?
Audiotranskripsjon er prosessen med å ta talte ord og gjøre dem til skrevet tekst. Tidligere ville en person sitte og skrive ord mens de ble talt. Nå eksisterer lydopptak av forskjellige typer og flere metoder for transkripsjon. Analoge og digitale innspillingsmetoder vil tillate en person som ikke er til stede under praten, fortsatt å transkribere teksten. I tillegg vil mange programvarepakker lese lydfiler og raskt konvertere dem til tekst uten å måtte spille dem av.
I mange år var lydtranskripsjon et spesialisert og kjedelig yrke. Mennesker som transkriberte tale måtte være til stede på taltidspunktet, noe som ofte betyr at selskaper måtte ansette personer som var opplært i avanserte teknikker som for eksempel stenografi. Dette begrenset også transkripsjonstjenester til de som hadde tilgang til en trent transkribent.
Med oppfinnelsen av lydopptak, endret dette feltet seg dramatisk. Med et opptak kunne transkriberen jobbe hvor som helst der innspillingen kunne leveres. I tillegg trengte transkripsjon ikke lenger korthet da innspillingen kunne reverseres og lyttet til flere ganger. En enkelt transkriberer kunne også jobbe for en rekke klienter samtidig, siden hun ikke lenger trengte å være til stede for talene.
Med økningen i datamaskinbruk og internetthastigheter forble feltet for transkripsjon stort sett det samme. Filer, i stedet for kassetter, ble ofte sendt på e-post i stedet for å bli sendt med vanlig post. Hastigheten på prosessen økte, men metodene gjorde det ikke.
Dette endret seg på slutten av 90-tallet med den økende bruken av programvare for talegjenkjenning og diktasjon. Jobben med å transkribere gikk mer og mer mot datahjelp og deretter full automatisering. Det kom ut programvarepakker som kunne lese informasjonen i en lydfil og bruke høyttalernes bølgemønster til å lage en tekstversjon av en tale. Dette vil ta sekunder i stedet for minuttene eller timene til en menneskelig transkriberer.
Computer-automatisert lydtranskripsjon har noen få feil som er vanskelige å overvinne, den største av dem er en relativt mangel på korrektiv tale. Når en menneskelig transkriberer lytter til tekst, kan hun rette små feil i talen for å gjøre den mer lesbar. Selv om noen transkripsjon er ordrett, noe som betyr at det er nøyaktig hva personen sa, er det mest ikke. Uten korrigerende tale vil et menneske ofte måtte sjekke transkripsjonen for feil før den brukes.
Den andre vanlige feilen ved datamaskinbasert lydtranskripsjon ligger i selve menneskers tale. Siden folk har et enormt spekter av toner og mønstre når de snakker, er det utrolig vanskelig å lage et dataprogram som kan lese og oversette hele utvalget nøyaktig. Dette betyr at en viss feil er vanlig i nesten all transkripsjonsprogramvare. Den vanligste måten å jobbe rundt denne feilen på er gjennom innlært tale, der programmet og en enkelt høyttaler jobber sammen nok til at programmet fokuserer på den enkeltes mønstre.