Vad är en akustisk modell?

En akustisk modell är i huvudsak en karta över rösten i förhållande till en serie tryckta ord. Denna teknik används i taligenkänningsprogram för att hjälpa en dator att lära sig att känna igen en persons talmönster. En akustisk modell är en av de två huvudfilerna som krävs för att köra ett taligenkänningsprogram; Den andra är språkmodellen, som indikerar troliga ord och talmönster som kan användas av talaren. Dessa modeller skapas genom att jämföra ljuddetaljer i en talad ljudfil med texten till de talade orden.

Taligenkänningsprogramvara är programvara utformad för att känna igen och transkribera eller svara på orden som en person säger. Många operativsystem är utformade med inbyggda grundläggande taligenkänningsfunktioner som användaren kan slå på och av. Taligenkänningsfunktioner på operativsystem ger vanligtvis användaren möjlighet att styra datorn och skriva ord på skärmen med sin röst.

För att få åtkomst till programvara för taligenkänning behöver en användare enMikrofon för att få sin röst till datorn, plus ett program som bearbetar ljudet. Medan många datorer har inbyggda mikrofoner tillåter en extern headsetmikrofon användaren fördelen med tydligare röstljud och friheten att röra sig runt i rummet medan de talar. Standalon -mjukvarumärken för taligenkänning inkluderar Lumenvox®, Loquendo® och Dragon®.

De flesta program för taligenkänning har akustisk modellprogrammering som gör det möjligt för programmet att känna igen variationer i uttal. De använder mönster i ljudet från talarens röst för att identifiera ord i tal. Många är designade med installationsprogramvara för att hjälpa användaren att skapa en akustisk modell utformad för att tolka sin egen röst. Vissa avancerade taligenkänningsprogram kan identifiera och tolka flera språk, ofta med en liten mängd sund information. Ju mer avancerat ett taligenkänningsprogram, desto mer liKely är det att exakt tolka ord baserat på dess sammanhang, inklusive var i en mening talas ett ord.

Studiefältet som utvecklar taligenkänningsteknik kallas beräkningslingvistik. Beräkningslingvistik involverar studier och design som skapar programvara programmerad för att förstå mänskligt tal. Detta område innehåller ofta information från studien av psykologi för att skapa akustiska modeller som mer exakt kan tolka tal.

Ordet "akustiskt" hänvisar i allmänhet till allt som har att göra med ljud. Även om akustiska modeller oftast används i taligenkänning, kan de också användas i musik. En akustisk modell av ett musikspår kan identifiera egenskaper som beats per minut, de musikaliska nycklarna eller dominerande tonhöjder i musiken. Denna information kan användas av ett datorprogram för att identifiera ett musikspår, eller den kan användas för att löst bestämma genren där musiken troligen kategoriseras. Akustiska modeller används också inom ett fält avStudie som heter Psychoacoustics, där forskare hoppas lära sig att strukturera musik som förutsägbart påverkar hjärnan.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?