Co to jest słuchanie muzyki?
Słuchanie maszynowe to przetwarzanie dźwięków przez komputer w sposób naśladujący przetwarzanie sygnału przez człowieka. Komputery można zaprogramować i przeszkolić w zakresie rozpoznawania i interpretacji zakresu wejść audio. Technologia ta może być stosowana na wiele różnych sposobów, od analizy inteligencji po naukę muzyki. Badacze w tej dziedzinie pracują w prywatnych firmach, instytucjach akademickich i agencjach rządowych, aby ulepszyć narzędzia do odsłuchu maszyn i znaleźć nowe aplikacje. Łączy elementy akustyki, elektrotechniki, robotyki i przetwarzania sygnałów.
Aby rozpoznać dźwięki, komputery muszą być w stanie je słyszeć i przetwarzać. Mogą używać przetworników dźwięku do obsługi szumu otoczenia lub mogą słuchać nagrań. Dźwięki można uruchamiać za pomocą algorytmów, aby określić, czym one są i co z nimi zrobić. Odpowiedzi komputerowe mogą zależeć od ich programowania, szkolenia i poziomu zaawansowania.
Prosty przykład słuchania przez maszynę można zobaczyć w przypadku klapek i oprogramowania aktywowanego głosem. Klapy umożliwiają ludziom włączanie i wyłączanie obwodów za pomocą ręcznego klaśnięcia, które aktywuje bazę. Oprogramowanie, które reaguje na polecenia głosowe, pozwala ludziom sterować nim za pomocą głosu, co wymaga umiejętności identyfikacji głosu i interpretacji dźwięków. Takie programy mogą wykorzystywać szkolenie do nauki rozpoznawania konkretnego mówcy i obsługiwania akcentów, zmian w składni i innych odmian między mówcami.
Bardziej złożone słuchanie maszynowe można wykorzystać w takich dziedzinach, jak muzyka, gdzie badacze identyfikują i badają wzorce. Na przykład muzykologowie medycyny sądowej mogą porównywać i kontrastować muzykę z różnych źródeł i mogą korzystać ze słuchania maszynowego w swojej pracy. Mogą ustalić, czy muzyka ma wspólne pochodzenie, czy też ma inne interesujące cechy. Technologii tej można także użyć do badania harmonii i rozwijania teorii na temat tego, jak mogła brzmieć muzyka historyczna.
Analiza inteligencji polega również na nasłuchiwaniu maszynowym. Ogromne ilości danych audio w formie rozmów telefonicznych, dyskusji w miejscach publicznych i tak dalej mogą wymagać przetworzenia przez agencje wywiadowcze. Płacenie ludziom za słuchanie wszystkich materiałów audio i opracowywanie raportów może być kosztowne, a znudzeni słuchacze mogą przegapić ważne informacje. Słuchanie na maszynie może pozwolić agencji na automatyczne przetwarzanie dźwięku w celu wyciągnięcia danych, które wymagają szczególnej uwagi, na podstawie słów kluczowych, dźwięków stresu w głosach i innych parametrów. Na podstawie tej automatycznej analizy analitycy analityczni mogą nadać priorytet swojej pracy, aby wysłuchać dźwięku, który najprawdopodobniej będzie najważniejszy jako pierwszy.