Skip to main content

Mi az akusztikus modell?

Az akusztikus modell lényegében a hang térképe a nyomtatott szavak sorozatához viszonyítva.Ezt a technológiát a beszédfelismerő programokban használják, hogy segítsék a számítógépet felismerni a személyek beszédmintáit.Az akusztikus modell a két fő fájl egyike, amely a beszédfelismerő program futtatásához szükséges;A másik a nyelvmodell, amely jelzi a valószínű szavakat és beszédmintákat, amelyeket a hangszóró használhat.Ezeket a modelleket úgy hozták létre, hogy összehasonlítják a beszélt audiofájl hang részleteit a beszélt szavak szövegével.

A beszédfelismerő szoftver olyan szoftver, amelynek célja az egy személy által mondott szavak felismerése és átírása vagy reagálása.Számos operációs rendszert beépített alapvető beszédfelismerési képességekkel terveztek, amelyeket a felhasználó be- és kikapcsolhat.A beszédfelismerési képességek az operációs rendszereken általában lehetőséget adnak a felhasználó számára, hogy a számítógépet és a szavakat írja be a képernyőn a hangjával.Ez feldolgozza a hangot.Míg sok számítógép beépített mikrofonokkal rendelkezik, a külső fejhallgató-mikrofon lehetővé teszi a felhasználó számára a tisztább hanghang előnyeit és a szabadságot, hogy beszéljen a szobában.Az önálló beszédfelismerő szoftver márkák között szerepel a Lumenvox , Loquendo , és a Dragon

A legtöbb beszédfelismerő program akusztikus modellprogramozással rendelkezik, amely lehetővé teszi a program számára, hogy felismerje a kiejtés variációit.A hangszórók hangjának mintáit használják a beszédben lévő szavak azonosításához.Sokan olyan beállítási szoftverrel készültek, hogy segítsék a felhasználót egy akusztikus modell létrehozásában, amelynek célja a saját hangjának értelmezése.Egyes fejlett beszédfelismerő programok több nyelvet azonosíthatnak és értelmezhetnek, gyakran apró mennyiségű hanginformációval.Minél fejlettebb beszédfelismerő program, annál valószínűbb, hogy pontosan értelmezi a szavakat annak kontextusán alapul, beleértve azt is, hogy hol mondják el egy szót egy mondatban.A számítási nyelvészet magában foglalja a tanulmányt és a tervezést, amely szoftvert hoz létre az emberi beszéd megértése érdekében.Ez a terület gyakran magában foglalja a pszichológia tanulmányozásából származó információkat olyan akusztikus modellek létrehozására, amelyek pontosabban tudják értelmezni a beszédet.

Az akusztikus szó általában bármire utal, amely a hanghoz kapcsolódik.Noha az akusztikus modelleket leggyakrabban használják a beszédfelismerésben, a zenében is használhatók.A zeneszám akusztikus modellje azonosíthatja a tulajdonságokat, mint például a ütések perc, a zenei kulcsok vagy a domináns pályák a zenében.Ezt az információt egy számítógépes program felhasználhatja a zeneszám azonosítására, vagy felhasználható a műfaj lazán meghatározására, amelyben a zene valószínűleg kategorizálódik.Az akusztikus modelleket a Psychoacoustics nevű tanulmányi területen is használják, amelyben a kutatók remélik, hogy megtanulják a zene felépítését, amely kiszámíthatóan befolyásolja az agyat.