Co to jest wydobycie audio?
Wydobycie audio jest zwykle używane w oprogramowaniu rozpoznawania mowy i analizie muzyki. Ta technologia daje użytkownikowi możliwość wyszukiwania mowy lub dźwięku muzycznego, który został przeanalizowany pod kątem określonych cech. W przypadku technologii rozpoznawania mowy, wydobycie audio identyfikuje słowa wypowiedziane w dźwięku i umieszcza je w pliku z możliwością wyszukiwania. Ta funkcja może być przydatna dla studentów lub osób w świecie biznesu, którzy biorą udział w wielu spotkaniach, ponieważ pozwala użytkownikowi łatwiej przeglądać aktualne informacje z prezentacji mowy. Ten rodzaj analizy może być również wykorzystany w muzyce do określenia cech takich jak Beats na minutę (BPM), klucz muzyczny i struktura muzyczna, informacje wykorzystywane do klasyfikacji muzyki.
W rozpoznawaniu mowy, w której technologia jest najczęściej stosowana, wydobycie audio jest stosowane do stworzenia modelu akustycznego. Oprogramowanie do rozpoznawania mowy modelu akustycznego w celu rozpoznawania wzorców mowy jako słów. Ta technologia jest opracowywana przez Audio Mining A RecOrding mowy, która jest porównywana do tekstu pasującego do wyrażenia mówionego. Komputer używa informacji do rozpoznawania słów, gdy użytkownik wydaje podobne dźwięki jak w modelu akustycznym. Model akustyczny jest używany w połączeniu z plikiem, który informuje program rozpoznawania mowy, jaki język interpretować i jakie wzorce słów prawdopodobnie będą wypowiedzieć w niektórych zdaniach i sytuacjach.
Muzycy i słuchacze muzyczne mogą skorzystać z wydobycia dźwięku w muzyce. Czasami oprogramowanie muzyczne, które kategoryzuje muzykę według gatunku, wykorzystuje wydobycie audio do organizowania muzyki. Proces identyfikuje i grupuje pliki muzyczne o podobieństwach dźwiękowych, które często występują w gatunkach muzycznych. Chociaż ta technologia może ułatwić organizację muzyki i znajdowanie nowej muzyki, może popełniać błędy klasyfikujące piosenki, które mają podobne zmierzone cechy, ale inny ogólny dźwięk. Audio Analiza SOFTware może być przydatny dla muzyków, zwłaszcza kompozytorów, ponieważ pozwala kompozytorowi skakać do określonych części struktury utworów, w tym muzycznych kluczowych zmian i słów w tekście.
Producent oprogramowania do rozpoznawania mowy Dragon® sprzedaje program o nazwie Audiomining®, który transkrybuje pliki audio i oznacza pliki, aby można je było wyszukać tekst. Dragon jest producentem komputerowych programów językoznawstwa, technicznego terminu dla dziedziny oprogramowania zaprojektowanego do interpretacji mowy. Wydobycie audio, gdy jest używane jako dwa słowa, jest ogólnym terminem, który odnosi się do analizy pliku dźwiękowego dla określonego zestawu charakterystyk dźwięku. Inni producenci oprogramowania do wydobywania audio to Nuance® i Nexidia®.