Qual è la connessione tra sintesi del linguaggio e riconoscimento?

Sintesi e riconoscimento del parlato sono i due lati dell'analisi del parlato computerizzata. La sintesi del linguaggio è la creazione del discorso umano da parte di un computer; Ad esempio, un computer che legge il testo scritto. Il riconoscimento vocale è la creazione di informazioni sul computer da parole pronunciate, come dettare un documento a un computer. Mentre i due processi non sono direttamente correlati, la sintesi del linguaggio e il riconoscimento si basano sia sulla capacità di un computer di comprendere il linguaggio e l'inflessione umana. Un metodo è l'output e l'altro è input.

I processi utilizzati dalla sintesi e dal riconoscimento del parlato sono molto simili, anche se il prodotto finale è diverso. Il processo è costituito da due parti, una parte con l'interazione umana e una senza. La porzione umana è quando le parole umane entrano nel programma; La parte non umana è quando il programma interoperatore l'input.

Un programma di sintesi vocale assumerà input umani nella forma o in linguaggio umano digitato o scritto. Il programma leggerà la lingua e determinerà WHat ogni parola è, usando il posizionamento della frase e la punteggiatura per determinare l'inflessione. Quando una parola potrebbe essere pronunciata in più modi, come nel caso di "Live", il programma cercherà parole vicine e indizi di contesto per determinare quale parola viene effettivamente utilizzata. Le parole andranno quindi alla seconda parte del programma, dove vengono pronunciate ad alta voce.

In un programma di riconoscimento vocale, il processo è opposto. L'input proviene da un altoparlante umano che dice parole in un computer. Il computer ascolterà ogni parola e confronterà il modello generato dalla voce dell'altoparlante con una libreria di possibili suoni e parole. Quindi prende una determinazione della parola più probabile e la invia alla seconda parte del sistema. Questa porzione in realtà stampa le parole sullo schermo, in modo simile a come il programma di sintesi dice le parole.

Poiché ogni altoparlante sembra leggermente diverso, sintesi vocale eI programmi di riconoscimento hanno spesso un ampio margine di errore. Uno dei modi in cui le persone combattono questi errori è attraverso profili vocali personalizzati. Un singolo oratore avrà il suo discorso analizzato dal programma per trovare i suoi specifici schemi vocali. Quando trova errori nella traduzione del computer, può correggerli specificamente. Le correzioni vengono analizzate e archiviate dal programma, quindi quando la parola fastidiosa si presenta di nuovo, il programma lo tradurrà correttamente.

Esiste un'ampia applicazione per i programmi di sintesi e riconoscimento del parlato. Nel campo medico, questi programmi consentono alle persone di comunicare chi altrimenti non potrebbe non essere in grado di farlo. Questi programmi hanno una vasta applicazione in attività come mezzo più rapido per tradurre rapporti e documenti. Il riconoscimento vocale è anche un metodo comune per impostare dispositivi a mani libere nelle automobili, consentendo alle persone di parlare al telefono in modo più sicuro durante la guida.

Qual è la connessione tra sintesi del linguaggio e riconoscimento?

ALTRE LINGUE

ARTICOLI CORRELATI

Come possiamo aiutare?