Co to jest górnictwo audio?
Eksploracja audio jest zwykle używana w oprogramowaniu do rozpoznawania mowy i analizie muzycznej. Technologia ta umożliwia użytkownikowi wyszukiwanie mowy lub muzyki, która została przeanalizowana pod kątem określonych cech. W przypadku użycia w technologii rozpoznawania mowy eksploracja audio identyfikuje mówione słowa w dźwięku i umieszcza je w pliku z możliwością wyszukiwania. Ta funkcja może być przydatna dla studentów lub osób ze świata biznesu, które biorą udział w wielu spotkaniach, ponieważ pozwala użytkownikowi łatwiej przeglądać aktualne informacje z prezentacji głosowych. Tego rodzaju analizy można również używać w muzyce do określania charakterystyk, takich jak uderzenia na minutę (BPM), klucz muzyczny i struktura muzyczna, informacje wykorzystywane do klasyfikowania muzyki.
W rozpoznawaniu mowy, gdzie technologia jest najczęściej wykorzystywana, eksploracja dźwięku jest wykorzystywana do stworzenia modelu akustycznego. Model akustyczny programuje oprogramowanie do rozpoznawania mowy do rozpoznawania wzorców mowy jako słów. Technologia ta została opracowana przez wydobycie dźwięku nagrania wypowiedzianej frazy, która jest porównywana z tekstem pasującym do wypowiedzianej frazy. Komputer wykorzystuje te informacje do rozpoznawania słów, gdy użytkownik wydaje dźwięki podobne do tych w modelu akustycznym. Model akustyczny jest używany w połączeniu z plikiem, który informuje program rozpoznający mowę, jaki język interpretować i jakie wzorce słów mogą być wypowiedziane w niektórych zdaniach i sytuacjach.
Muzycy i słuchacze muzyki mogą czerpać korzyści z wydobywania dźwięku w muzyce. Czasami oprogramowanie muzyczne kategoryzujące muzykę według gatunku używa eksploracji dźwięku do organizowania muzyki. Proces identyfikuje i grupuje pliki muzyczne z podobieństwami dźwięku, które często występują w gatunkach muzycznych. Chociaż ta technologia może ułatwić organizowanie muzyki i znajdowanie nowej muzyki, może powodować błędy w klasyfikacji utworów o podobnych cechach pomiarowych, ale o innym ogólnym brzmieniu. Oprogramowanie do analizy dźwięku może być przydatne dla muzyków, zwłaszcza kompozytorów, ponieważ pozwala kompozytorowi przeskoczyć do określonych części struktury utworu, w tym zmian klawiszy muzycznych i słów w tekście.
Producent oprogramowania do rozpoznawania mowy Dragon® sprzedaje program o nazwie AudioMining®, który transkrybuje pliki audio i oznacza je, aby można było wyszukiwać tekst. Dragon jest producentem komputerowych programów lingwistycznych, technicznych terminów w dziedzinie oprogramowania zaprojektowanego do interpretacji mowy. Eksploracja audio, gdy jest używana jako dwa słowa, jest ogólnym terminem, który odnosi się do analizy pliku dźwiękowego pod kątem określonego zestawu właściwości audio. Inni producenci oprogramowania do wydobywania dźwięku to Nuance® i Nexidia®.