¿Qué es la escucha de la máquina?

La escucha de la máquina es el procesamiento de sonidos a través de una computadora de una manera que imita el procesamiento de señales humanas. Las computadoras se pueden programar y capacitar para reconocer e interpretar una gama de entradas de audio. Esta tecnología se puede aplicar en una amplia variedad de formas, desde el análisis de inteligencia hasta el estudio de la música. Los investigadores en este campo trabajan en empresas privadas, instituciones académicas y agencias gubernamentales para mejorar las herramientas de escucha de máquinas y encontrar nuevas aplicaciones. Integra elementos de acústica, ingeniería eléctrica, robótica y procesamiento de señales.

Para reconocer los sonidos, las computadoras deben poder escucharlos y procesarlos. Pueden usar camionetas de sonido para manejar el ruido ambiental, o pueden escuchar grabaciones. Los sonidos se pueden ejecutar a través de algoritmos para determinar qué son y qué hacer con ellos. Las respuestas de la computadora pueden depender de su programación, entrenamiento y nivel de sofisticación.

Se puede ver un ejemplo simple de escucha de máquinas con badajos y vozSoftware activado. Los badajos permiten a las personas encender y apagar los circuitos con un aplaudir que activa la unidad base. El software que responde a los comandos de voz puede permitir a las personas controlarlo con sus voces, lo que requiere la capacidad de identificar la voz e interpretar los sonidos. Dichos programas pueden usar la capacitación para aprender a reconocer un altavoz específico y manejar acentos, cambios en la sintaxis y otras variaciones entre los altavoces.

La escucha de máquina más compleja se puede usar en campos como la música, donde los investigadores identifican y estudian patrones. Los musicólogos forenses, por ejemplo, pueden comparar y contrastar música de diferentes fuentes y pueden usar la escucha de máquinas en su trabajo. Pueden determinar si la música parece tener un origen común o tener otras características de interés. Esta tecnología también se puede utilizar para estudiar la armonía y desarrollar teorías sobre cómo podría haber sonado la música histórica.

El análisis de inteligencia también se basa en la escucha de la máquina. Las grandes cantidades de datos de audio en forma de conversaciones telefónicas, discusiones en espacios públicos, etc., pueden necesitar ser procesadas por agencias de inteligencia. Pagar a los seres humanos para escuchar todo el audio y desarrollar informes puede ser costoso, y los oyentes aburridos pueden perder información importante. La escucha de la máquina puede permitir que una agencia procese automáticamente el audio para extraer datos que requieren atención cercana, según las palabras clave, los tonos de estrés en las voces y otros parámetros. Los analistas de inteligencia pueden priorizar su trabajo sobre la base de este análisis automático para escuchar el audio que es más probable que sea importante primero.

OTROS IDIOMAS