Qu'est-ce que la reconnaissance vocale robuste?
La reconnaissance vocale robuste peut détecter adéquatement la parole dans des conditions défavorables comme des environnements bruyants ou dans des enregistrements rugueux. Cela peut avoir des applications importantes dans un certain nombre de domaines, tels que les forces de l'ordre ou la conception des aides auditives, par exemple. La recherche et le développement sur ce sujet se produisent dans les établissements universitaires, les entreprises privées et les organisations caritatives avec un intérêt dans ce domaine du monde entier. Les carrières dans ce domaine sont ouvertes à des gens comme les ingénieurs du son, les programmeurs informatiques et les audiologistes.
La reconnaissance de la parole conventionnelle souffre du problème d'avoir été conçu pour des environnements idéaux. Un algorithme peut reconnaître la parole si elle se produit dans un environnement calme avec peu ou pas de bruit de fond, et si l'orateur articule clairement les mots. De tels programmes peuvent lutter contre les accents qu'ils n'ont pas appris, et ils ont également tendance à se décomposer dans des environnements avec beaucoup de bruit de fond. Le monde est souvent bruyant, et donc un tel équipementPeut être d'une utilisation limitée dans certains paramètres sans reconnaissance vocale robuste.
Dans la dictée, par exemple, la plupart des systèmes reposent sur un microphone porté près de la bouche, pour permettre à la voix de l'orateur de dominer afin que le programme puisse traiter avec précision la parole. La reconnaissance vocale utilisée dans des applications telles que l'écoute à distance pour l'application de la loi, la conception des aides auditives et la restauration des enregistrements historiques peuvent également avoir des difficultés avec le bruit de fond. Une reconnaissance vocale robuste implique le développement d'algorithmes qui peuvent traiter et éliminer ce bruit pour laisser le discours.
Cela nécessite des capacités informatiques complexes. Les environnements bruyants peuvent contenir une grande variété de sons, ce qui rend difficile de simplement créer un filtre de passe qui réduirait une gamme de bruit. Le filtre peut ne pas attraper tous les bruits de problème et pourrait également interférer avec le discours. En reconnaissance de la parole robuste, progRammers travaille à développer des programmes qui peuvent identifier la parole et le séparer des autres pistes du son. Une fois séparés, il peut être soumis à une autre passe pour nettoyer le signal, permettant au programme d'exécuter un algorithme normal de reconnaissance vocale pour déterminer ce qui est dit.
La reconnaissance de la parole précise peut être importante pour les menus automatisés, la dictée et d'autres applications en temps réel. Le développement d'une reconnaissance vocale robuste peut également aider à la création d'aides auditives et de logiciels qui, et à identifier les voix humaines dans un bourdonnement d'autres bruit, et les transmettre uniquement à l'auditeur. Cela rend la reconnaissance vocale plus utile dans des environnements tels que des fêtes bondées et des événements où plusieurs sons peuvent rivaliser, potentiellement à noyer des voix pour les auditeurs s'appuyant sur la reconnaissance vocale.