Che cos'è la sintesi vocale?

La sintesi vocale è un processo in cui la comunicazione verbale viene replicata attraverso un dispositivo artificiale. Un computer che converte il testo in parlato è un tipo di sintetizzatore vocale.

Le prime forme di sintesi vocale sono state implementate attraverso macchine progettate per funzionare come il tratto vocale umano. La macchina parlante creata da Wolfgang von Kempelen nel 1700 ne è un esempio. Con questo dispositivo, il parlato veniva prodotto attraverso un soffietto da cucina, una canna da cornamusa e una campana di clarinetto. Il soffietto della cucina era progettato per agire come un polmone, mentre la glottide (l'area delle corde vocali) era rappresentata attraverso la canna della cornamusa. La campana del clarinetto è stata la bocca.

Il funzionamento del dispositivo era completamente manuale. La mano destra controllava una serie di leve mentre la mano sinistra manipolava la campana del clarinetto (bocca). C'era anche la possibilità di tappare le "narici", per produrre un suono meno nasale. In entrambi i casi, fino a quando i controlli di base sono stati utilizzati correttamente, la macchina ha ricevuto flusso d'aria. Questo flusso d'aria determinava i tipi di suoni che sarebbero stati prodotti.

Le macchine che parlavano in seguito nel corso dei secoli XVIII e XIX mantennero questo assetto, sebbene vi fossero miglioramenti. Ad esempio, alla fine del 1800, Joseph Faber creò una macchina parlante che poteva ricevere input attraverso una tastiera e un pedale. La macchina era anche molto creativa, dato che il suono usciva attraverso una "faccia" artificiale.

Quando arrivò il 20 ° secolo, le innovazioni nell'elettronica permisero alla sintesi vocale di prendere una direzione ancora più potente. Sebbene la premessa di imitare il tratto vocale umano fosse sempre la stessa, le macchine che parlavano all'inizio del XX secolo potevano produrre suoni migliori poiché l'ingresso era più preciso.

Tuttavia, non è stato fino all'avvento dei computer che la sintesi vocale poteva essere effettivamente utilizzata al di fuori dell'arena dell'intrattenimento. Ciò è dovuto principalmente al fatto che i sintetizzatori vocali potrebbero essere memorizzati nel software anziché in una macchina separata. Inoltre, con i computer come ausilio, la sintesi vocale potrebbe assumere una forma diversa; usando le voci umane come fonte principale di suono.

Questa forma di sintesi vocale è conosciuta come concatenativa. Il processo funziona collegando varie registrazioni del linguaggio umano. Il suono risultante è molto più naturale e piacevole per l'orecchio. Ciò è in contrasto con i programmi che usano la sintesi articolatoria, in cui il discorso viene replicato attraverso un modello computerizzato del tratto vocale.

I sintetizzatori vocali commerciali possono utilizzare metodi concatenativi o articolatori, ma entrambi sono in grado di raggiungere lo stesso obiettivo; essere in grado di offrire alle persone l'opportunità di ascoltare il testo. Ciò è particolarmente utile in situazioni in cui la lettura è invadente o impossibile.

Nel mondo degli affari, tali situazioni sono molto comuni, soprattutto per le transazioni telefoniche. Senza alternative di sintesi vocale (TTS), gli imprenditori dovrebbero spendere soldi per assumere ancora più personale del servizio clienti. Le soluzioni sintetizzate evitano questo problema, poiché tutto è fatto al computer; non un essere umano.

Anche il linguaggio sintetizzato svolge un ruolo nella vita quotidiana, specialmente per le persone con disabilità. Parlare di orologi, dizionari e altri dispositivi può rendere le cose più facili per le persone che hanno difficoltà a vedere o leggere. Il discorso sintetizzato è persino in grado di dare voce a individui che non sapevano parlare affatto. Steven Hawking, un famoso fisico, è un esempio di spicco. Da quando la malattia di Lou Gehrig lo ha reso muto, Hawking usa un sintetizzatore vocale per comunicare con le persone.

Ci sono anche applicazioni TTS disponibili per aiutare le persone con varie attività informatiche. Per ottenere questo tipo di applicazioni, la maggior parte degli utenti dovrà acquistare software separato o scaricare patch. Quest'ultima opzione è generalmente gratuita, a seconda del sistema operativo o del programma di elaborazione testi utilizzato. Tuttavia, se una persona decide di acquistare software separato, potrebbe avere accesso a un sistema di qualità superiore. Esempi specifici possono essere visti attraverso Natural Reader 7 e Text Aloud 2.

In definitiva, la sintesi vocale è una tecnologia che ha rivoluzionato il modo in cui l'umanità comunica. In un certo senso, dà al testo una vita propria. Offre inoltre al mondo l'opportunità di ascoltare i pensieri di individui brillanti che normalmente sarebbero rimasti senza voce.

Che cos'è la sintesi vocale?

Questo articolo è stato utile?