Hva er automatisk transkripsjon?
Automatisk transkripsjon er prosessen med å produsere et skriftlig transkripsjon av muntlig eller innspilt tale gjennom bruk av datamaskiner og uten direkte menneskelig innblanding. Nøyaktig automatisk transkripsjon krever transkripsjonsprogramvare av høy kvalitet og en enhet som nøyaktig kan motta auditive innspill. Generelt er det også nødvendig at talen eller opptaket som skal transkriberes er rimelig fri for forvrengning og forstyrrelser fra bakgrunnsstøy. Det er også gjort forsøk på å transkribere musikk ved bruk av datamaskiner som kjører spesialisert transkripsjonsprogramvare. Musikktranskripsjon innebærer å skrive ut notene til et gitt stykke musikk, spesielt når det ikke er noen forhåndsbestemmende notasjon for den musikken, som tilfellet er med improviserte soloer.
God transkripsjonsprogramvare er nødvendig for vellykket automatisk transkripsjon. Programvaren er ansvarlig for å behandle auditive innspill, skille en kontinuerlig språkstrøm i separate ord, gjenkjenne disse ordene og representere dem korrekt i tekst. En feil på noe trinn i denne prosessen resulterer generelt i et transkripsjon som skiller seg noe fra kildematerialet. God automatisk transkripsjonsprogramvare skal være i stand til å gjenkjenne de subtile forskjellene mellom lignende ord og kompensere for ulike stiler og hastighet på tale. Vanskelig å forstå aksenter har en tendens til å være problematisk for selv den beste transkripsjonsprogramvaren.
Noen mennesker bruker automatisk transkripsjonsprogramvare fordi de foretrekker diktering av å direkte skrive eller skrive teksten sin. Noen former for automatisk transkripsjonsprogramvare er spesielt bra for dette formålet fordi de kan "lære" stemmene til menneskene hvis ord de transkriberer. I slike tilfeller blir ikke automatisk transkripsjon brukt til å lage transkripsjoner av tale fra en rekke forskjellige kilder, så det er ikke behov for at programvaren er åpen for en lang rekke talemønstre. Å tillate denne optimaliseringsprosessen, som kan skje under utvidet bruk av programvaren av en person eller under en foreløpig kalibrering, kan øke nøyaktigheten og potensielle hastigheten til diktering.
Datamaskiner er dessverre ikke så godt egnet til å gjenkjenne menneskelig tale konsekvent og nøyaktig som mennesker er. De kan for eksempel ikke bruke kontekstuelle ledetråder hvis de ikke klarer å forstå et bestemt ord. Som sådan er det ofte nødvendig for et menneske å korrekturles avskrifter opprettet ved automatisk transkripsjon. Mindre feil i formatering og forskjellige feil i transkripsjon er i mange tilfeller vanlig med mindre den transkriberte talen er veldig tydelig. Fortsatt kan bruk av datastyrt transkripsjon raskt lage et solid grunnlag for en transkripsjon som bare krever begrenset menneskelig intervensjon før innsending eller bruk.