Co to jest słuchanie maszyny?
Słuchanie maszyny to przetwarzanie dźwięków przez komputer w sposób, który naśladuje ludzkie przetwarzanie sygnału. Komputery można zaprogramować i szkolić do rozpoznawania i interpretacji zakresu danych wejściowych audio. Technologię tę można zastosować w szerokim zakresie sposobów, od analizy wywiadowczej po studiowanie muzyki. Naukowcy z tej terenowej pracują w prywatnych firmach, instytucjach akademickich i agencjach rządowych w celu ulepszenia narzędzi do słuchania maszyn i znalezienie nowych aplikacji. Integruje elementy akustyki, inżynierii elektrycznej, robotyki i przetwarzania sygnału.
W celu rozpoznania dźwięków komputery muszą być w stanie je usłyszeć i przetwarzać. Mogą używać przetworników dźwiękowych do obsługi szumu otoczenia lub mogą słuchać nagrań. Dźwięki można przeprowadzić przez algorytmy, aby ustalić, czym są i co z nimi zrobić. Odpowiedzi komputerowe mogą zależeć od ich programowania, szkolenia i poziomu wyrafinowania.
Prosty przykład słuchania maszyny można zobaczyć za pomocą klapów i głosuAktywowane oprogramowanie. Klapery pozwalają ludziom włączać i wyłączać obwody za pomocą klaskania ręcznego, który aktywuje jednostkę podstawową. Oprogramowanie, które reaguje na polecenia głosowe, może pozwolić ludziom kontrolować je za pomocą swoich głosów, co wymaga możliwości identyfikacji głosu i interpretacji dźwięków. Takie programy mogą wykorzystać szkolenie, aby nauczyć się rozpoznawać określonego głośnika i obsługiwać akcenty, zmiany w składni i inne odmiany między głośnikami.
Bardziej złożone słuchanie maszyn można stosować w dziedzinach takich jak muzyka, w których badacze identyfikują i badań. Na przykład muzykolodzy sądowi mogą porównywać i kontrastować muzykę z różnych źródeł i mogą używać słuchania maszyn w swojej pracy. Mogą ustalić, czy muzyka wydaje się mieć wspólne pochodzenie, czy ma inne interesujące cechy. Tę technologię można również wykorzystać do badania harmonii i opracowania teorii na temat tego, jak mogła brzmieć muzyka historyczna.
Analiza inteligencji polega również na słuchaniu maszyn. Ogromne ilości danych audio w postaci rozmów telefonicznych, dyskusji w przestrzeniach publicznych i tak dalej mogą wymagać przetwarzania przez agencje wywiadowcze. Płacenie ludzi za wysłuchanie wszystkich raportów audio i opracowywanie może być drogie, a znudzone słuchacze mogą przegapić ważne informacje. Słuchanie maszyn może pozwolić agencji automatycznie przetwarzać dźwięk wyciągania danych, które wymagają ścisłej uwagi, na podstawie słów kluczowych, tonów naprężeń w głosach i innych parametrach. Analitycy wywiadu mogą ustalić priorytety swojej pracy na podstawie tej automatycznej analizy, aby wysłuchać dźwięku, który najprawdopodobniej będzie ważny.