O que é síntese de fala?

A síntese da fala é um processo em que a comunicação verbal é replicada através de um dispositivo artificial. Um computador que converte texto em fala é um tipo de sintetizador de fala.

As primeiras formas de síntese da fala foram implementadas através de máquinas projetadas para funcionar como o trato vocal humano. A máquina de falar criada por Wolfgang von Kempelen na década de 1700 é um exemplo. Com esse dispositivo, a fala foi produzida através de um fole de cozinha, uma palheta de gaita de foles e um sino de clarinete. O fole da cozinha foi projetado para agir como um pulmão, enquanto a glote (a área das cordas vocais) era representada através da palheta de gaita de foles. O sino de clarinete serviu de boca.

A operação do dispositivo foi totalmente manual. A mão direita controlava uma série de alavancas enquanto a mão esquerda manipulava o sino do clarinete (boca). Havia também a opção de tapar as narinas, para produzir um som menos nasal. De qualquer forma, desde que os controles básicos tenham sido usados ​​corretamente, a máquina recebeu fluxo de ar. Esse fluxo de ar determinou os tipos de sons que seriam produzidos.

Máquinas de falar subsequentes ao longo dos séculos 18 e 19 mantiveram essa configuração, embora houvesse melhorias. Por exemplo, no final de 1800, Joseph Faber criou uma máquina de falar que poderia receber informações através de um teclado e um pedal. A máquina também foi muito criativa, pois o som saiu através de um 'rosto' artificial.

Quando o século 20 chegou, as inovações na eletrônica permitiram que a síntese da fala seguisse uma direção ainda mais poderosa. Embora a premissa de imitar o trato vocal humano ainda fosse a mesma, as máquinas de falar do início do século XX podiam produzir sons melhores, já que a entrada era mais precisa.

No entanto, não foi até o advento dos computadores que a síntese de fala poderia realmente ser usada fora da arena do entretenimento. Isso ocorre principalmente porque os sintetizadores de fala podem ser armazenados no software em vez de em uma máquina separada. Além disso, com os computadores como auxílio, a síntese da fala pode assumir uma forma diferente; usando vozes humanas como a principal fonte de som.

Essa forma de síntese da fala é conhecida como concatenativa. O processo funciona conectando várias gravações da fala humana. O som resultante é muito mais natural e agradável ao ouvido. Isso contrasta com os programas que usam síntese articulatória, onde a fala é replicada através de um modelo computadorizado do trato vocal.

Os sintetizadores comerciais de fala podem empregar métodos concatenativos ou articulatórios, mas ambos são capazes de atingir o mesmo objetivo; ser capaz de dar às pessoas a oportunidade de ouvir texto. Isso é especialmente útil em situações em que a leitura é intrusiva ou impossível.

No mundo dos negócios, essas situações são muito comuns, principalmente para transações por telefone. Sem alternativas de conversão de texto em fala (TTS), os empresários teriam que gastar dinheiro contratando ainda mais pessoal de atendimento ao cliente. As soluções sintetizadas evitam esse problema, pois tudo é feito por computador; não é um ser humano.

A fala sintetizada também desempenha um papel na vida cotidiana, especialmente para pessoas com deficiência. Relógios falantes, dicionários e outros dispositivos podem facilitar as coisas para as pessoas que têm problemas para ver ou ler. A fala sintetizada é capaz de dar voz a indivíduos que não conseguiam falar nada. Steven Hawking, um famoso físico, é um exemplo proeminente. Como a doença de Lou Gehrig o deixou mudo, Hawking usa um sintetizador de voz para se comunicar com as pessoas.

Existem também aplicativos TTS disponíveis para ajudar as pessoas em várias atividades do computador. Para obter esses tipos de aplicativos, a maioria dos usuários precisará comprar software separado ou fazer download de patches. A última opção geralmente é gratuita, dependendo do sistema operacional ou do programa de processamento de texto que está sendo usado. No entanto, se uma pessoa decidir comprar software separado, ela poderá ter acesso a um sistema de qualidade superior. Exemplos específicos podem ser vistos no Natural Reader 7 e Text Aloud 2.

Por fim, a síntese da fala é uma tecnologia que revolucionou a forma como a humanidade se comunica. Em certo sentido, dá ao texto uma vida própria. Também dá ao mundo a oportunidade de ouvir os pensamentos de indivíduos brilhantes que normalmente não teriam voz.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?