Wat is robuuste spraakherkenning?

Robuuste spraakherkenning kan spraak adequaat detecteren onder ongunstige omstandigheden zoals lawaaierige omgevingen of in krassende opnames. Dit kan belangrijke toepassingen hebben op een aantal gebieden, zoals wetshandhaving of het ontwerp van gehoorapparaten, bijvoorbeeld. Onderzoek en ontwikkeling naar dit onderwerp vindt plaats bij academische instellingen, particuliere bedrijven en liefdadigheidsorganisaties met interesse op dit gebied over de hele wereld. Carrières op dit gebied staan open voor mensen zoals geluidstechnici, computerprogrammeurs en audiologen.

Conventionele spraakherkenning lijdt aan het probleem van het zijn ontworpen voor ideale omgevingen. Een algoritme kan spraak herkennen als het voorkomt in een rustige omgeving met weinig tot geen achtergrondgeluid, en als de spreker de woorden duidelijk verwoordt. Dergelijke programma's kunnen worstelen met accenten die ze niet hebben geleerd, en ze hebben ook de neiging om af te breken in omgevingen met veel achtergrondgeluid. De wereld is vaak luidruchtig, en dus dergelijke apparatuurkan in sommige instellingen van beperkt nut zijn zonder robuuste spraakherkenning.

In dictaat, bijvoorbeeld, zijn de meeste systemen afhankelijk van een microfoon die dicht bij de mond wordt gedragen, om de stem van de spreker te laten domineren zodat het programma de spraak nauwkeurig kan verwerken. Spraakherkenning die wordt gebruikt in toepassingen zoals luisteren op afstand voor wetshandhaving, hoorapparaatontwerp en herstel van historische opnames kan ook moeite hebben met achtergrondgeluid. Robuuste spraakherkenning omvat de ontwikkeling van algoritmen die dit geluid kunnen verwerken en weggooien om alleen de toespraak te verlaten.

Dit vereist complexe computervaardigheden. Lawaaierige omgevingen kunnen een breed scala aan geluiden bevatten, waardoor het moeilijk is om eenvoudig een passfilter te maken dat een reeks ruis zou uitsnijden. Het filter vangt misschien niet alle probleemgeluiden en kan de spraak mogelijk ook verstoren. In robuuste spraakherkenning, PROGRammers werken aan het ontwikkelen van programma's die spraak kunnen identificeren en het scheiden van andere geluidsporen. Eenmaal gescheiden, kan het worden onderworpen aan een andere pass om het signaal op te ruimen, waardoor het programma een normaal spraakherkenning -algoritme kan uitvoeren om te bepalen wat er wordt gezegd.

Nauwkeurige spraakherkenning kan belangrijk zijn voor geautomatiseerde menu's, dictaat en andere realtime toepassingen. De ontwikkeling van robuuste spraakherkenning kan ook helpen bij het creëren van gehoorapparaten en software die en het lokaliseren van menselijke stemmen in een brom van ander geluid, en alleen deze naar de luisteraar overbrengen. Dit maakt spraakherkenning nuttiger in omgevingen zoals drukke feesten en evenementen waar meerdere geluiden kunnen concurreren, mogelijk overstemmende stemmen voor luisteraars die vertrouwen op spraakherkenning.

Wat is robuuste spraakherkenning?

ANDERE TALEN