Qu'est-ce qu'un modèle acoustique?

Un modèle acoustique est essentiellement une carte de la voix en relation avec une série de mots imprimés. Cette technologie est utilisée dans les programmes de reconnaissance vocale pour aider un ordinateur à apprendre à reconnaître les schémas de parole d'une personne. Un modèle acoustique est l'un des deux principaux fichiers nécessaires à l'exécution d'un programme de reconnaissance vocale. l'autre est le modèle de langage, qui indique les mots et les schémas de parole susceptibles d'être utilisés par le locuteur. Ces modèles sont créés en comparant les détails sonores d'un fichier audio parlé au texte des mots parlés.

Un logiciel de reconnaissance vocale est un logiciel conçu pour reconnaître et transcrire ou répondre aux mots qu'une personne dit. De nombreux systèmes d'exploitation sont conçus avec des fonctionnalités de base de reconnaissance vocale intégrées que l'utilisateur peut activer et désactiver. Les capacités de reconnaissance vocale sur les systèmes d'exploitation permettent généralement à l'utilisateur de contrôler l'ordinateur et de saisir des mots à l'écran à l'aide de sa voix.

Pour accéder à un logiciel de reconnaissance vocale, un utilisateur a besoin d'un microphone pour transmettre sa voix à l'ordinateur, ainsi que d'un programme qui traite le son. Alors que de nombreux ordinateurs ont des microphones intégrés, un microphone avec casque externe offre à l'utilisateur l'avantage d'un son de voix plus clair et la liberté de se déplacer dans la pièce tout en parlant. Les marques de logiciels de reconnaissance vocale autonomes comprennent LumenVox®, Loquendo® et Dragon®.

La plupart des programmes de reconnaissance vocale comportent un modèle acoustique permettant au programme de reconnaître les variations de prononciation. Ils utilisent des modèles dans le son de la voix du locuteur pour identifier les mots dans la parole. Beaucoup sont conçus avec un logiciel de configuration conçu pour aider l'utilisateur à créer un modèle acoustique conçu pour interpréter sa propre voix. Certains programmes de reconnaissance vocale avancés peuvent identifier et interpréter plusieurs langues, souvent avec une infime quantité d'informations sonores. Plus un programme de reconnaissance vocale est avancé, plus il est susceptible d'interpréter avec précision les mots en fonction de son contexte, y compris l'endroit où un mot est prononcé.

Le domaine d'étude qui développe la technologie de reconnaissance vocale s'appelle la linguistique informatique. La linguistique informatique implique une étude et une conception qui créent un logiciel programmé pour comprendre la parole humaine. Ce champ incorpore souvent des informations issues de l'étude de la psychologie pour créer des modèles acoustiques capables d'interpréter plus précisément la parole.

Le mot "acoustique" désigne généralement tout ce qui a trait au son. Bien que les modèles acoustiques soient le plus souvent utilisés dans la reconnaissance vocale, ils peuvent également l'être dans la musique. Un modèle acoustique d'un morceau de musique peut identifier des propriétés telles que les battements à la minute, les notes musicales ou les notes dominantes dans la musique. Un programme informatique peut utiliser ces informations pour identifier une piste musicale ou déterminer de manière approximative le genre dans lequel la musique est probablement classée. Les modèles acoustiques sont également utilisés dans un domaine d'étude appelé psychoacoustique, dans lequel les chercheurs espèrent apprendre à structurer une musique qui, de manière prévisible, affecte le cerveau.

Qu'est-ce qu'un modèle acoustique?

Cet article vous a‑t‑il été utile ?