Hva er automatisk transkripsjon?
Automatisk transkripsjon er prosessen med å produsere et skriftlig transkripsjon av muntlig eller registrert tale gjennom bruk av datamaskiner og uten direkte menneskelig inngripen. Nøyaktig automatisk transkripsjon krever transkripsjonsprogramvare av høy kvalitet og en enhet som nøyaktig kan motta auditive innganger. Generelt er det også nødvendig at talen eller innspillingen som skal transkriberes er rimelig fri for forvrengning og forstyrrelse fra bakgrunnsstøy. Det er også gjort forsøk på å transkribere musikk med bruk av datamaskiner som kjører spesialisert transkripsjonsprogramvare. Musikktranskripsjon innebærer å skrive ut notatene til et gitt stykke musikk, spesielt når det ikke er noen eksisterende notasjon for den musikken, som tilfellet er med improviserte soloer.
God transkripsjonsprogramvare er nødvendig for vellykket automatisk transkripsjon. Programvaren er ansvarlig for å behandle den auditive inngangen, og skiller en kontinuerlig språkstrøm i separate ord, og gjenkjenner disse ordene,og representerer dem riktig i tekst. En feil på et hvilket som helst trinn i denne prosessen resulterer generelt i et transkripsjon som skiller seg noe fra kildematerialet. God automatisk transkripsjonsprogramvare skal kunne gjenkjenne de subtile forskjellene mellom lignende ord og kompensere for forskjellige stiler og hastigheter. Vanskelig å forstå aksenter har en tendens til å være problematisk for selv den beste transkripsjonsprogramvaren.
Noen mennesker bruker automatisk transkripsjonsprogramvare fordi de foretrekker diktat for å skrive eller skrive teksten direkte. Noen former for automatisk transkripsjonsprogramvare er spesielt bra for dette formålet fordi de kan "lære" stemmene til menneskene hvis ord de transkriberer. I slike tilfeller brukes ikke automatisk transkripsjon for å lage avskrifter av tale fra en rekke forskjellige kilder, så det er ikke behov for at programvaren er åpen for et bredt utvalgav talemønstre. Å tillate denne optimaliseringsprosessen, som kan oppstå under utvidet bruk av programvaren av en person eller under en foreløpig kalibrering, kan øke nøyaktigheten og potensielle hastighetens hastighet.
Datamaskiner er dessverre ikke så godt egnet til å konsekvent og nøyaktig gjenkjenne menneskelig tale som mennesker er. De kan for eksempel ikke benytte seg av kontekstuelle ledetråder hvis de ikke klarer å forstå et bestemt ord. Som sådan er det ofte nødvendig for et menneske å korrekturlese transkripsjoner opprettet gjennom automatisk transkripsjon. Mindre feil i formatering og forskjellige feil i transkripsjon er i mange tilfeller vanlig med mindre den transkriberte talen er veldig tydelig. Fortsatt kan bruk av datastyrt transkripsjon raskt lage et solid fundament for et transkripsjon som bare krever begrenset menneskelig intervensjon før innsending eller bruk.