Qu'est-ce que l'extraction audio?

L'exploration audio est généralement utilisée dans les logiciels de reconnaissance vocale et d'analyse musicale. Cette technologie donne à l'utilisateur la possibilité de rechercher dans le son de la parole ou de la musique des caractéristiques spécifiques analysées. Lorsqu'elle est utilisée dans la technologie de reconnaissance vocale, l'exploration audio identifie les mots parlés dans l'audio et les place dans un fichier interrogeable. Cette fonctionnalité peut être utile aux étudiants ou aux professionnels du monde des affaires qui assistent à de nombreuses réunions car elle permet à l'utilisateur de parcourir plus facilement les informations thématiques issues de présentations. Ce type d'analyse peut également être utilisé en musique pour déterminer des caractéristiques telles que les battements par minute (BPM), la clé musicale et la structure musicale, informations utilisées pour classer la musique.

Dans la reconnaissance vocale, où la technologie est le plus souvent utilisée, l'exploration audio est utilisée pour créer un modèle acoustique. Un modèle acoustique programme un logiciel de reconnaissance de la parole pour reconnaître les modèles de parole sous forme de mots. Cette technologie est développée par l'extraction audio d'un enregistrement d'une phrase parlée, qui est comparée à un texte correspondant à la phrase parlée. L'ordinateur utilise ces informations pour reconnaître les mots lorsque l'utilisateur émet des sons similaires à ceux du modèle acoustique. Un modèle acoustique est utilisé en combinaison avec un fichier qui indique au programme de reconnaissance de la parole quelle langue interpréter et quels motifs de mots sont susceptibles d'être prononcés dans certaines phrases et situations.

Les musiciens et les auditeurs peuvent bénéficier de l'extraction audio dans la musique. Parfois, les logiciels de musique classant la musique par genre utilisent l’exploration audio pour organiser la musique. Le processus identifie et regroupe des fichiers de musique présentant des similitudes sonores qui se produisent fréquemment dans les genres musicaux. Bien que cette technologie puisse faciliter l’organisation de la musique et la recherche de nouvelles musiques, elle peut faire des erreurs en classant des chansons ayant des caractéristiques mesurées similaires mais un son global différent. Les logiciels d’analyse audio peuvent être utiles aux musiciens, en particulier aux compositeurs, car ils permettent d’accéder à des parties spécifiques de la structure de la chanson, notamment les modifications de touches musicales et les mots contenus dans les paroles.

Le fabricant de logiciels de reconnaissance vocale, Dragon®, vend un programme appelé AudioMining® qui transcrit les fichiers audio et les marque afin qu’ils puissent rechercher du texte. Dragon est un fabricant de programmes de linguistique informatique, terme technique qui désigne le domaine des logiciels conçus pour interpréter la parole. L'exploration audio, lorsqu'elle est utilisée comme deux mots, est un terme général qui fait référence à l'analyse d'un fichier son pour un ensemble déterminé de caractéristiques audio. Nuance® et Nexidia® sont d'autres fabricants de logiciels d'exploration audio.

Qu'est-ce que l'extraction audio?

Cet article vous a‑t‑il été utile ?