Wat is automatische transcriptie?
Automatische transcriptie is het proces van het produceren van een geschreven transcript van gesproken of opgenomen spraak door middel van computers en zonder directe menselijke tussenkomst. Nauwkeurige automatische transcriptie vereist hoogwaardige transcriptiesoftware en een apparaat dat nauwkeurig auditieve invoer kan ontvangen. Over het algemeen is het ook noodzakelijk dat de te transcriberen spraak of opname redelijk vrij is van vervorming en interferentie van achtergrondruis. Er zijn ook pogingen gedaan om muziek te transcriberen met behulp van computers met gespecialiseerde transcriptiesoftware. Muziektranscriptie omvat het schrijven van de noten van een bepaald muziekstuk, met name wanneer er geen bestaande notatie voor die muziek is, zoals het geval is met geïmproviseerde solo's.
Goede transcriptiesoftware is noodzakelijk voor succesvolle automatische transcriptie. De software is verantwoordelijk voor het verwerken van de auditieve invoer, het scheiden van een continue taalstroom in afzonderlijke woorden, het herkennen van die woorden en het correct weergeven ervan in tekst. Een mislukking in elk stadium van dit proces resulteert in het algemeen in een transcript dat enigszins verschilt van het bronmateriaal. Goede automatische transcriptiesoftware moet in staat zijn om de subtiele verschillen tussen soortgelijke woorden te herkennen en verschillende stijlen en spraaksnelheden te compenseren. Moeilijk te begrijpen accenten zijn vaak problematisch voor zelfs de beste transcriptiesoftware.
Sommige mensen gebruiken automatische transcriptiesoftware omdat ze de voorkeur geven aan dicteren boven het direct typen of schrijven van hun tekst. Sommige vormen van automatische transcriptiesoftware zijn bijzonder goed voor dit doel omdat ze de stemmen kunnen "leren" van de mensen wier woorden ze transcriberen. In dergelijke gevallen wordt automatische transcriptie niet gebruikt om transcripties van spraak te maken uit verschillende bronnen, zodat de software niet open hoeft te staan voor een breed scala aan spraakpatronen. Als u dit optimalisatieproces toestaat, wat kan gebeuren tijdens langdurig gebruik van de software door één persoon of tijdens een voorlopige kalibratie, kan de nauwkeurigheid en potentiële dicteersnelheid aanzienlijk toenemen.
Computers zijn helaas niet zo geschikt om menselijke spraak consequent en nauwkeurig te herkennen als mensen. Ze kunnen bijvoorbeeld geen gebruik maken van contextuele aanwijzingen als ze een bepaald woord niet begrijpen. Als zodanig is het vaak nodig dat een mens transcripties corrigeert die zijn gemaakt door automatische transcriptie. Kleine fouten in de opmaak en verschillende fouten in de transcriptie komen in veel gevallen veel voor, tenzij de getranscribeerde spraak erg duidelijk is. Toch kan het gebruik van geautomatiseerde transcriptie snel een solide basis vormen voor een transcriptie waarvoor slechts beperkte menselijke tussenkomst vereist is voorafgaand aan indiening of gebruik.