Co je akustický model?
Akustický model je v podstatě mapa hlasu ve vztahu k řadě tištěných slov. Tato technologie se používá v programech rozpoznávání řeči, aby pomohla počítači naučit se rozpoznat vzorce řeči osoby. Akustický model je jedním ze dvou hlavních souborů nezbytných pro spuštění programu rozpoznávání řeči; Druhým je jazykový model, který označuje pravděpodobná slova a řečové vzorce, které může reproduktor použít. Tyto modely jsou vytvořeny porovnáním zvukových detailů mluveného zvukového souboru s textem mluvených slov. Mnoho operačních systémů je navrženo s vestavěnými základními schopnostmi rozpoznávání řeči, které může uživatel zapnout a vypnout. Schopnosti rozpoznávání řeči na operačních systémech obvykle poskytují uživateli možnost ovládat počítač a psát slova na obrazovce pomocí jejího hlasu.
Pro přístup k softwaru pro rozpoznávání řeči potřebuje uživatel aMikrofon, který dostane svůj hlas do počítače, plus program, který zpracovává zvuk. Zatímco mnoho počítačů má vestavěné mikrofony, externí mikrofon náhlavní soupravy umožňuje uživateli výhodu jasnějšího hlasového zvuku a svobodu pohybovat se po místnosti při mluvení. Mezi samostatné značky softwaru pro rozpoznávání řeči patří Lumenvox®, Loquendo® a Dragon®.
Většina programů rozpoznávání řeči má programování akustických modelů, které umožňuje programu rozpoznat změny výslovnosti. Používají vzory ve zvuku hlasu reproduktoru k identifikaci slov v řeči. Mnoho z nich je navrženo s nastavovacím softwarem vyrobeným tak, aby uživateli pomohl vytvořit akustický model určený k interpretaci jejího vlastního hlasu. Některé pokročilé programy rozpoznávání řeči mohou identifikovat a interpretovat více jazyků, často s malým množstvím zvukových informací. Čím pokročilejší program rozpoznávání řeči, tím více liKELY Jde o přesně interpretaci slov na základě jeho kontextu, včetně toho, kde se ve větě vysloví slovo.
Studijní pole, které vyvíjí technologii rozpoznávání řeči, se nazývá výpočetní lingvistika. Výpočetní lingvistika zahrnuje studium a návrh, který vytváří software naprogramovaný pro porozumění lidské řeči. Toto pole často zahrnuje informace ze studie psychologie k vytvoření akustických modelů, které mohou přesněji interpretovat řeč.
Slovo „akustické“ se obecně týká všeho, co má co do činění se zvukem. Ačkoli akustické modely se nejčastěji používají při rozpoznávání řeči, lze je také použít v hudbě. Akustický model hudební skladby může identifikovat vlastnosti, jako jsou rytmy za minutu, hudební klíče nebo dominantní hřiště v hudbě. Tuto informace lze použít počítačovým programem k identifikaci hudební skladby, nebo ji lze použít k volnému určení žánru, ve kterém je hudba pravděpodobně kategorizována. Akustické modely se také používají v poliStudie zvaná psychoakustika, ve které vědci doufají, že se naučí strukturovat hudbu, která předvídatelně ovlivňuje mozek.