Cos'è un modello acustico?

Un modello acustico è essenzialmente una mappa della voce in relazione a una serie di parole stampate. Questa tecnologia viene utilizzata nei programmi di riconoscimento vocale per aiutare un computer a imparare a riconoscere i modelli vocali di una persona. Un modello acustico è uno dei due file principali necessari per eseguire un programma di riconoscimento vocale; L'altro è il modello linguistico, che indica probabili parole e schemi vocali che possono essere usati dall'altoparlante. Questi modelli vengono creati confrontando i dettagli sonori di un file audio parlato con il testo delle parole pronunciate.

Il software di riconoscimento vocale è un software progettato per riconoscere e trascrivere o rispondere alle parole che una persona dice. Molti sistemi operativi sono progettati con funzionalità di riconoscimento vocale di base integrate che l'utente può attivare e disattivare. Le funzionalità di riconoscimento vocale sui sistemi operativi di solito forniscono all'utente la possibilità di controllare il computer e digitare le parole sullo schermo usando la sua voce.

Per accedere al software di riconoscimento vocale, un utente ha bisogno di unMicrofono per portare la sua voce al computer, oltre a un programma che elabora il suono. Mentre molti computer hanno microfoni integrati, un microfono auricolare esterno consente all'utente il vantaggio di un suono vocale più chiaro e la libertà di muoversi nella stanza mentre parlano. I marchi di software di riconoscimento vocale autonomo includono Lumenvox®, Loquendo® e Dragon®.

La maggior parte dei programmi di riconoscimento vocale ha una programmazione del modello acustico che consente al programma di riconoscere le variazioni della pronuncia. Usano i modelli nel suono della voce dell'altoparlante per identificare le parole nel discorso. Molti sono progettati con il software di configurazione realizzato per aiutare l'utente a creare un modello acustico progettato per interpretare la propria voce. Alcuni programmi di riconoscimento vocale avanzato possono identificare e interpretare più lingue, spesso con una piccola quantità di informazioni sonore. Più un programma di riconoscimento vocale più avanzato, più liKely è interpretare accuratamente le parole in base al suo contesto, incluso dove in una frase viene pronunciata una parola.

Il campo di studio che sviluppa la tecnologia di riconoscimento vocale si chiama linguistica computazionale. La linguistica computazionale prevede lo studio e il design che crea software programmato per comprendere il linguaggio umano. Questo campo spesso incorpora le informazioni dallo studio della psicologia per creare modelli acustici che possano interpretare in modo più accurato il linguaggio.

La parola "acustica" si riferisce generalmente a tutto ciò che ha a che fare con il suono. Sebbene i modelli acustici siano spesso usati nel riconoscimento vocale, possono anche essere usati nella musica. Un modello acustico di una pista musicale può identificare proprietà come beat al minuto, chiavi musicali o tiri dominanti nella musica. Queste informazioni possono essere utilizzate da un programma per computer per identificare una traccia musicale, oppure possono essere utilizzate per determinare liberamente il genere in cui la musica è probabilmente classificata. I modelli acustici sono anche usati in un campo diStudio chiamato psicoacoustica, in cui i ricercatori sperano di imparare a strutturare la musica che colpisce prevedibilmente il cervello.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?