Co to jest model akustyczny?
Model akustyczny jest zasadniczo mapą głosu w odniesieniu do serii drukowanych słów. Ta technologia jest wykorzystywana w programach rozpoznawania mowy, aby pomóc komputerowi w rozpoznaniu wzorców mowy. Model akustyczny jest jednym z dwóch głównych plików niezbędnych do uruchomienia programu rozpoznawania mowy; Drugi to model języka, który wskazuje prawdopodobne słowa i wzorce mowy, które mogą być używane przez mówcę. Modele te są tworzone przez porównanie szczegółów dźwięku mówionego pliku audio z tekstem słów mówionych.
Oprogramowanie do rozpoznawania mowy to oprogramowanie zaprojektowane do rozpoznawania i transkrypcji lub odpowiadania na słowa, które mówi osoba. Wiele systemów operacyjnych zostało zaprojektowanych z wbudowanymi podstawowymi możliwościami rozpoznawania mowy, które użytkownik może włączać i wyłączać. Możliwości rozpoznawania mowy w systemach operacyjnych zwykle dają użytkownikowi możliwość kontrolowania komputera i wpisywania słów na ekranie za pomocą jej głosu.
Aby uzyskać dostęp do oprogramowania do rozpoznawania mowy, użytkownik potrzebujeMikrofon, aby dostać głos do komputera, a także program przetwarzający dźwięk. Podczas gdy wiele komputerów ma wbudowane mikrofony, zewnętrzny mikrofon zestawu słuchawkowy pozwala użytkownikowi korzyść wyraźniejszego dźwięku głosowego i swobody poruszania się po pokoju podczas mówienia. Samodzielne marki oprogramowania do rozpoznawania mowy obejmują Lumenvox®, Loquendo® i Dragon®.
Większość programów rozpoznawania mowy ma programowanie modelu akustycznego, które pozwala programowi rozpoznać zmiany wymowy. Używają wzorów w dźwięku głosu mówcy, aby zidentyfikować słowa w mowie. Wiele zostało zaprojektowanych z oprogramowaniem instalacyjnym, które pomoże użytkownikowi stworzyć model akustyczny zaprojektowany do interpretacji jej własnego głosu. Niektóre zaawansowane programy rozpoznawania mowy mogą identyfikować i interpretować wiele języków, często z niewielką ilością solidnych informacji. Im bardziej zaawansowany program rozpoznawania mowy, tym bardziej Likely ma dokładnie interpretować słowa na podstawie jego kontekstu, w tym w miejscu zdania wypowiadane słowo.
Dziedzina badań, która rozwija technologię rozpoznawania mowy, nazywa się lingwistyką obliczeniową. Lingwistyka obliczeniowa obejmuje badania i projektowanie, które tworzy oprogramowanie zaprogramowane w celu zrozumienia mowy ludzkiej. Ta dziedzina często zawiera informacje z badania psychologii do tworzenia modeli akustycznych, które mogą dokładniej interpretować mowę.
Słowo „akustyczne” ogólnie odnosi się do wszystkiego, co ma związek z dźwiękiem. Chociaż modele akustyczne są najczęściej stosowane w rozpoznawaniu mowy, można je również stosować w muzyce. Model akustyczny utworu muzycznego może zidentyfikować właściwości takie jak Beats na minutę, klucze muzyczne lub dominujące boiska w muzyce. Informacje te mogą być wykorzystywane przez program komputerowy do identyfikacji utworu muzycznego lub można je wykorzystać do luźnego określenia gatunku, w którym muzyka jest prawdopodobnie klasyfikowana. Modele akustyczne są również stosowane w dziedzinieBadanie zatytułowane Psychoakoustics, w których naukowcy mają nadzieję nauczyć się struktury muzyki, która przewidywalnie wpływa na mózg.