Co je audio těžba?
Audio mining se obvykle používá v softwaru pro rozpoznávání řeči a při analýze hudby. Tato technologie umožňuje uživateli vyhledávat prostřednictvím řeči nebo hudebního zvuku, který byl analyzován na specifické vlastnosti. Při použití v technologii rozpoznávání řeči dolování zvuku identifikuje mluvená slova ve zvuku a vloží je do prohledávatelného souboru. Tato funkce může být užitečná pro studenty nebo studenty v obchodním světě, kteří se účastní mnoha setkání, protože umožňuje uživateli snadněji procházet aktuální informace z řečových prezentací. Tento typ analýzy lze také použít v hudbě k určení charakteristik, jako jsou rytmy za minutu (BPM), hudební klíč a hudební struktura, informace, které se používají ke klasifikaci hudby.
V rozpoznávání řeči, kde je technologie nejčastěji používána, se využívá audio těžba k vytvoření akustického modelu. Akustický model programuje software pro rozpoznávání řeči pro rozpoznávání řečových vzorů jako slov. Tato technologie je vyvinuta zvukovou těžbou záznamu mluvené fráze, která je porovnána s textem odpovídajícím mluvené frázi. Počítač používá informace k rozpoznání slov, když uživatel vydává podobné zvuky jako v akustickém modelu. Akustický model se používá v kombinaci se souborem, který říká programu pro rozpoznávání řeči, jaký jazyk interpretovat a jaké vzorce slov bude pravděpodobně mluvit v určitých větách a situacích.
Hudebníci i posluchači hudby mohou těžit z těžby zvuku v hudbě. Někdy hudební software, který kategorizuje hudbu podle žánru, používá k organizaci hudby dolování zvuku. Tento proces identifikuje a seskupuje hudební soubory se zvukovými podobnostmi, které se často vyskytují v hudebních žánrech. I když tato technologie může usnadnit organizování hudby a nalezení nové hudby, může to způsobit chyby při klasifikaci písní, které mají podobné měřené vlastnosti, ale odlišný celkový zvuk. Software pro analýzu zvuku může být užitečný pro hudebníky, zejména pro skladatele, protože umožňuje skladateli přejít na konkrétní části struktury písně, včetně změn hudebních klíčů a slov v textech.
Výrobce softwaru pro rozpoznávání řeči Dragon® prodává program s názvem AudioMining®, který přepisuje zvukové soubory a označuje soubory, aby je bylo možné hledat v textu. Dragon je výrobce programů počítačové lingvistiky, což je technický termín pro oblast softwaru určeného k interpretaci řeči. Audio mining, je-li použit jako dvě slova, je obecný pojem, který odkazuje na analýzu zvukového souboru pro určenou sadu zvukových charakteristik. Mezi další výrobce softwaru pro těžbu zvuku patří Nuance® a Nexidia®.