Wat is robuuste spraakherkenning?
Robuuste spraakherkenning kan spraak adequaat detecteren onder ongunstige omstandigheden zoals lawaaierige omgevingen of in krassende opnames. Dit kan belangrijke toepassingen hebben op een aantal gebieden, zoals bijvoorbeeld wetshandhaving of het ontwerp van gehoorapparaten. Onderzoek en ontwikkeling naar dit onderwerp vinden plaats bij academische instellingen, particuliere bedrijven en liefdadigheidsorganisaties met een interesse op dit gebied over de hele wereld. Carrières op dit gebied staan open voor mensen zoals geluidstechnici, computerprogrammeurs en audiologen.
Conventionele spraakherkenning lijdt onder het probleem dat het is ontworpen voor ideale omgevingen. Een algoritme kan spraak herkennen als deze voorkomt in een rustige omgeving met weinig tot geen achtergrondgeluid en als de spreker de woorden duidelijk verwoordt. Dergelijke programma's kunnen worstelen met accenten die ze niet hebben geleerd, en ze hebben ook de neiging af te breken in omgevingen met veel achtergrondgeluid. De wereld is vaak luidruchtig en daarom kan dergelijke apparatuur in sommige omgevingen van beperkt nut zijn zonder krachtige spraakherkenning.
Bij dicteren, bijvoorbeeld, vertrouwen de meeste systemen op een microfoon die dicht bij de mond wordt gedragen, zodat de stem van de spreker kan domineren zodat het programma de spraak nauwkeurig kan verwerken. Spraakherkenning die wordt gebruikt in toepassingen zoals luisteren op afstand voor wetshandhaving, het ontwerpen van gehoorapparaten en het herstellen van historische opnamen kan ook problemen hebben met achtergrondgeluiden. Robuuste spraakherkenning omvat de ontwikkeling van algoritmen die deze ruis kunnen verwerken en weggooien om alleen de spraak achter te laten.
Dit vereist complexe rekenmogelijkheden. Lawaaierige omgevingen kunnen een breed scala aan geluiden bevatten, waardoor het moeilijk is om eenvoudig een passfilter te maken dat een scala aan ruis zou elimineren. Het filter vangt mogelijk niet alle probleemgeluiden op en kan mogelijk ook de spraak verstoren. Bij robuuste spraakherkenning werken programmeurs aan programma's die spraak kunnen identificeren en scheiden van andere geluidssporen. Eenmaal gescheiden, kan het worden onderworpen aan een andere doorgang om het signaal op te ruimen, waardoor het programma een normaal spraakherkenningsalgoritme kan uitvoeren om te bepalen wat er wordt gezegd.
Nauwkeurige spraakherkenning kan belangrijk zijn voor geautomatiseerde menu's, dictaten en andere realtime-toepassingen. De ontwikkeling van robuuste spraakherkenning kan ook helpen bij het maken van gehoorapparaten en software die menselijke stemmen lokken in een zoemend geluid, en deze alleen naar de luisteraar overbrengen. Dit maakt spraakherkenning nuttiger in omgevingen zoals drukke feesten en evenementen waar meerdere geluiden kunnen concurreren, waardoor mogelijk stemmen worden overstemd voor luisteraars die vertrouwen op spraakherkenning.