Wat is een akoestisch model?

Een akoestisch model is in wezen een kaart van de stem in relatie tot een reeks gedrukte woorden. Deze technologie wordt gebruikt in spraakherkenningsprogramma's om een computer te helpen leren de spraakpatronen van een persoon te herkennen. Een akoestisch model is een van de twee belangrijkste bestanden die nodig zijn om een spraakherkenningsprogramma uit te voeren; De andere is het taalmodel, dat waarschijnlijk woorden en spraakpatronen aangeeft die door de spreker kunnen worden gebruikt. Deze modellen worden gemaakt door de geluidsdetails van een gesproken audiobestand te vergelijken met de tekst van de gesproken woorden.

Software voor spraakherkenning is software die is ontworpen om de woorden te herkennen en te transcriberen of te reageren die een persoon zegt. Veel besturingssystemen zijn ontworpen met ingebouwde fundamentele spraakherkenningsmogelijkheden die de gebruiker kan in- en uitschakelen. Spraakherkenningsmogelijkheden op besturingssystemen geven de gebruiker meestal de mogelijkheid om de computer te besturen en woorden op het scherm te typen met behulp van haar stem.

Om toegang te krijgen tot spraakherkenningssoftware, heeft een gebruiker een nodigMicrofoon om haar stem naar de computer te brengen, plus een programma dat het geluid verwerkt. Hoewel veel computers ingebouwde microfoons hebben, stelt een externe headset-microfoon de gebruiker het voordeel van duidelijker spraakgeluid en de vrijheid om zich tijdens het spreken door de kamer te bewegen. Standalone spraakherkenningssoftware merken omvatten Lumenvox®, Loquendo® en Dragon®.

De meeste spraakherkenningsprogramma's hebben akoestische modelprogrammering waarmee het programma variaties in uitspraak kan herkennen. Ze gebruiken patronen in het geluid van de stem van de luidspreker om woorden in spraak te identificeren. Velen zijn ontworpen met setup -software gemaakt om de gebruiker te helpen een akoestisch model te maken dat is ontworpen om haar eigen stem te interpreteren. Sommige geavanceerde programma's voor spraakherkenning kunnen meerdere talen identificeren en interpreteren, vaak met een kleine hoeveelheid geluidsinformatie. Hoe geavanceerder een spraakherkenningsprogramma, hoe meer liKely het is om woorden nauwkeurig te interpreteren op basis van zijn context, inclusief waar in een zin een woord wordt gesproken.

Het vakgebied dat spraakherkenningstechnologie ontwikkelt, wordt computationele taalkunde genoemd. Computationele taalkunde omvat studie en ontwerp dat software creëert die is geprogrammeerd om menselijke spraak te begrijpen. Dit veld bevat vaak informatie uit de studie van psychologie om akoestische modellen te creëren die spraak nauwkeuriger kunnen interpreteren.

Het woord "akoestisch" verwijst over het algemeen naar alles wat met geluid te maken heeft. Hoewel akoestische modellen meestal worden gebruikt bij spraakherkenning, kunnen ze ook in muziek worden gebruikt. Een akoestisch model van een muzieknummer kan eigenschappen zoals beats per minuut, de muzikale sleutels of dominante velden in de muziek identificeren. Deze informatie kan door een computerprogramma worden gebruikt om een muziektrack te identificeren, of het kan worden gebruikt om het genre losjes te bepalen waarin de muziek waarschijnlijk wordt gecategoriseerd. Akoestische modellen worden ook gebruikt in een veld vanstudie genaamd psychoacoustics, waarin onderzoekers hopen te leren muziek te structureren die voorspelbaar de hersenen beïnvloedt.

Wat is een akoestisch model?

ANDERE TALEN