Che cos'è il mining audio?

Il mining audio viene solitamente utilizzato nel software di riconoscimento vocale e nell'analisi della musica. Questa tecnologia offre all'utente la possibilità di effettuare ricerche attraverso l'audio vocale o musicale che è stato analizzato per caratteristiche specifiche. Se utilizzato nella tecnologia di riconoscimento vocale, il mining audio identifica le parole pronunciate nell'audio e le inserisce in un file ricercabile. Questa funzione può essere utile per gli studenti o coloro che lavorano nel mondo degli affari a molte riunioni perché consente all'utente di consultare più facilmente le informazioni di attualità dalle presentazioni vocali. Questo tipo di analisi può essere utilizzato anche in musica per determinare caratteristiche come battiti al minuto (BPM), chiave musicale e struttura musicale, informazioni utilizzate per classificare la musica.

Nel riconoscimento vocale, dove la tecnologia viene più spesso utilizzata, il mining audio viene utilizzato per creare un modello acustico. Un modello acustico programma un software di riconoscimento vocale per riconoscere gli schemi vocali come parole. Questa tecnologia è sviluppata dall'audio mining per la registrazione di una frase parlata, che viene confrontata con il testo corrispondente alla frase parlata. Il computer utilizza le informazioni per riconoscere le parole quando l'utente emette suoni simili a quelli del modello acustico. Un modello acustico viene utilizzato in combinazione con un file che indica al programma di riconoscimento vocale quale lingua interpretare e quali schemi di parole sono suscettibili di essere pronunciati in determinate frasi e situazioni.

Musicisti e ascoltatori di musica possono entrambi beneficiare dell'audio mining in musica. A volte, il software musicale che classifica la musica per genere utilizza il mining audio per organizzare la musica. Il processo identifica e raggruppa i file musicali con somiglianze audio che si verificano frequentemente nei generi musicali. Sebbene questa tecnologia possa facilitare l'organizzazione della musica e la ricerca di nuova musica, può fare errori nella classificazione di brani con caratteristiche misurate simili ma con un suono complessivo diverso. Il software di analisi audio può essere utile per i musicisti, in particolare i compositori, poiché consente al compositore di passare a parti specifiche della struttura della canzone, inclusi i cambiamenti dei tasti musicali e le parole all'interno dei testi.

Il produttore di software di riconoscimento vocale Dragon® vende un programma chiamato AudioMining® che trascrive i file audio e contrassegna i file in modo che possano essere ricercati per il testo. Dragon è un produttore di programmi di linguistica informatica, il termine tecnico per il campo del software progettato per interpretare il discorso. Il mining audio, quando usato come due parole, è un termine generale che si riferisce all'analisi di un file audio per un determinato set di caratteristiche audio. Altri produttori di software di mining audio includono Nuance® e Nexidia®.

Che cos'è il mining audio?

Questo articolo è stato utile?