Skip to main content

O que é escuta de máquina?

A escuta de máquina é o processamento de sons através de um computador de forma a imitar o processamento de sinais humanos. Os computadores podem ser programados e treinados para reconhecer e interpretar uma variedade de entradas de áudio. Essa tecnologia pode ser aplicada em uma ampla variedade de maneiras, desde a análise da inteligência até o estudo da música. Pesquisadores neste campo trabalham em empresas privadas, instituições acadêmicas e agências governamentais para melhorar as ferramentas de escuta de máquinas e encontrar novas aplicações. Ele integra elementos de acústica, engenharia elétrica, robótica e processamento de sinais.

Para reconhecer sons, os computadores precisam poder ouvi-los e processá-los. Eles podem usar captadores de som para lidar com o ruído ambiente ou ouvir gravações. Os sons podem ser executados através de algoritmos para determinar o que são e o que fazer com eles. As respostas do computador podem depender de sua programação, treinamento e nível de sofisticação.

Um exemplo simples de audição de máquina pode ser visto com clappers e software ativado por voz. Clappers permitem que as pessoas liguem e desliguem os circuitos com um aplauso manual que ativa a unidade base. O software que responde aos comandos de voz pode permitir que as pessoas o controlem com suas vozes, o que requer a capacidade de identificar a voz e interpretar os sons. Esses programas podem usar o treinamento para aprender a reconhecer um alto-falante específico e lidar com sotaques, alterações na sintaxe e outras variações entre os alto-falantes.

A escuta de máquinas mais complexa pode ser usada em campos como a música, onde os pesquisadores identificam e estudam padrões. Os musicólogos forenses, por exemplo, podem comparar e contrastar músicas de diferentes fontes e podem usar a audição por máquina em seus trabalhos. Eles podem determinar se a música parece ter uma origem comum ou se tem outras características de interesse. Essa tecnologia também pode ser usada para estudar a harmonia e desenvolver teorias sobre como a música histórica pode ter soado.

A análise de inteligência também depende da escuta da máquina. Enormes quantidades de dados de áudio na forma de conversas telefônicas, discussões em espaços públicos etc. podem precisar ser processadas pelas agências de inteligência. Pagar os seres humanos para ouvir todo o áudio e desenvolver relatórios pode ser caro, e ouvintes entediados podem perder informações importantes. A escuta automática pode permitir que uma agência processe automaticamente o áudio para extrair dados que requerem muita atenção, com base em palavras-chave, tons de estresse nas vozes e outros parâmetros. Os analistas de inteligência podem priorizar seu trabalho com base nessa análise automática para ouvir o áudio que provavelmente será importante primeiro.