Co je to akustický model?

Akustický model je v podstatě mapa hlasu ve vztahu k řadě tištěných slov. Tato technologie se používá v programech rozpoznávání řeči, které pomáhají počítači naučit se rozpoznávat řečové vzorce člověka. Akustický model je jedním ze dvou hlavních souborů nezbytných pro spuštění programu rozpoznávání řeči; druhým je jazykový model, který označuje pravděpodobná slova a vzorce řeči, které může mluvčí použít. Tyto modely jsou vytvářeny porovnáním zvukových podrobností mluveného zvukového souboru s textem mluvených slov.

Software pro rozpoznávání řeči je software určený k rozpoznávání a přepisování nebo odpovídání na slova, která osoba říká. Mnoho operačních systémů je navrženo se zabudovanými základními schopnostmi rozpoznávání řeči, které může uživatel zapínat a vypínat. Schopnosti rozpoznávání řeči v operačních systémech obvykle umožňují uživateli ovládat počítač a psát slova na obrazovce pomocí hlasu.

Pro přístup k softwaru pro rozpoznávání řeči potřebuje uživatel mikrofon, aby mohl dostat svůj hlas do počítače, plus program, který zvuk zpracuje. Přestože mnoho počítačů má vestavěné mikrofony, umožňuje externí mikrofon náhlavní soupravy uživateli jasnější hlasový zvuk a svobodu pohybu po místnosti během hovoru. Mezi samostatné značky softwaru pro rozpoznávání řeči patří LumenVox®, Loquendo® a Dragon®.

Většina programů rozpoznávání řeči má programování akustických modelů, které umožňuje programu rozpoznávat variace výslovnosti. Používají vzory ve zvuku hlasu mluvčího k identifikaci slov v řeči. Mnoho z nich je navrženo pomocí instalačního softwaru vytvořeného s cílem pomoci uživateli vytvořit akustický model určený k interpretaci jejího vlastního hlasu. Některé pokročilé programy rozpoznávání řeči mohou identifikovat a interpretovat více jazyků, často s malým množstvím zvukových informací. Čím pokročilejší je program pro rozpoznávání řeči, tím je pravděpodobnější, že přesně interpretuje slova na základě svého kontextu, včetně toho, kde se ve větě mluví slovo.

Studijní obor, který vyvíjí technologii rozpoznávání řeči, se nazývá výpočetní lingvistika. Výpočetní lingvistika zahrnuje studium a design, který vytváří software naprogramovaný k porozumění lidské řeči. Toto pole často zahrnuje informace ze studia psychologie k vytvoření akustických modelů, které mohou přesněji interpretovat řeč.

Slovo „akustický“ se obecně týká všeho, co souvisí se zvukem. Ačkoli akustické modely se nejčastěji používají při rozpoznávání řeči, lze je použít i v hudbě. Akustický model hudební stopy dokáže identifikovat vlastnosti jako rytmy za minutu, hudební klávesy nebo dominantní výšky v hudbě. Tyto informace mohou být použity počítačovým programem k identifikaci hudební stopy nebo mohou být použity k volnému určení žánru, ve kterém je hudba pravděpodobně roztříděna. Akustické modely jsou také používány v studijním oboru zvaném psychoakustika, ve kterém vědci doufají, že se naučí strukturovat hudbu, která předvídatelně ovlivňuje mozek.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?