¿Qué es la síntesis del habla?

La síntesis del habla es un proceso donde la comunicación verbal se replica a través de un dispositivo artificial. Una computadora que convierte el texto en discurso es un tipo de sintetizador del habla.

Las primeras formas de síntesis del habla se implementaron a través de máquinas diseñadas para funcionar como el tracto vocal humano. La máquina de hablar creada por Wolfgang Von Kempelen en la década de 1700 es un ejemplo. Con este dispositivo, el discurso se produjo a través de una cocina a continuación, una caña de gaita y una campana de clarinete. La cocina a continuación fue diseñada para actuar como un pulmón, mientras que la glotis (el área de las cuerdas vocales) se representó a través de la caña de gaita. La campana del clarinete sirvió como boca.

El funcionamiento del dispositivo fue completamente manual. La mano derecha controlaba una serie de palancas mientras la mano izquierda manipulaba la campana del clarinete (boca). También estaba la opción de conectar las "fosas nasales", para producir un sonido menos nasal. De cualquier manera, siempre y cuando los controles básicos se utilizaran correctamente, la máquina RECFlujo de aire EVIVE. Este flujo de aire determinó los tipos de sonidos que se producirían.

Las máquinas de habla posterior durante los siglos XVIII y XIX mantuvieron esta configuración, aunque hubo mejoras. Por ejemplo, a fines del siglo XIX, Joseph Faber creó una máquina para hablar que podría recibir la entrada a través de un teclado y un pedal. La máquina también fue muy creativa, ya que el sonido salió a través de una "cara" artificial.

.

Cuando llegó el siglo XX, las innovaciones en la electrónica permitieron que la síntesis del habla tomara una dirección aún más poderosa. Aunque la premisa de imitar el tracto vocal humano seguía siendo la misma, las máquinas de habla de principios del siglo XX podrían producir mejores sonidos ya que la entrada era más precisa.

Sin embargo, no fue hasta el advenimiento de las computadoras que la síntesis del habla en realidad podría usarse fuera de la arena del entretenimiento. Esto es principalmente porque SpeLos sintetizadores ECH podrían almacenarse en software en lugar de una máquina separada. Además, con las computadoras como ayuda, la síntesis del habla podría asumir una forma diferente; Usar voces humanas como la fuente principal del sonido.

Esta forma de síntesis del habla se conoce como concatenativa. El proceso funciona conectando varias grabaciones del habla humana. El sonido resultante es mucho más natural y agradable para el oído. Esto contrasta con los programas que utilizan la síntesis articulatoria, donde el discurso se replica a través de un modelo computarizado del tracto vocal.

Los sintetizadores comerciales del habla pueden emplear métodos concatenativos o articulatorios, pero ambos pueden lograr el mismo objetivo; poder dar a las personas la oportunidad de escuchar mensajes de texto. Esto es especialmente útil en situaciones en las que la lectura es molesta o imposible.

En el mundo de los negocios, tales situaciones son muy comunes, especialmente para las transacciones telefónicas. Sin alternativas de texto a voz (TTS), negociosLos propietarios tendrían que gastar dinero contratando aún más personal de servicio al cliente. Las soluciones sintetizadas evitan este problema, ya que todo lo hace la computadora; No es un ser humano.

El discurso sintetizado también juega un papel en la vida diaria, especialmente para las personas discapacitadas. Los relojes, diccionarios y otros dispositivos pueden facilitar las cosas para las personas que tienen problemas para ver o leer. El discurso sintetizado incluso puede dar voz a las personas que no podían hablar en absoluto. Steven Hawking, un físico famoso, es un ejemplo destacado. Desde que la enfermedad de Lou Gehrig lo ha hecho mudo, Hawking utiliza un sintetizador de voz para comunicarse con las personas.

También hay aplicaciones TTS disponibles para ayudar a las personas con varias actividades informáticas. Para obtener este tipo de aplicaciones, la mayoría de los usuarios tendrán que comprar software separado o descargar parches. La última opción suele ser gratuita, dependiendo del sistema operativo o el programa de procesamiento de textos que se utiliza. Sin embargo,Si una persona decide comprar un software separado, podría tener acceso a un sistema de mayor calidad. Se pueden ver ejemplos específicos a través del lector natural 7 y el texto en voz alta 2.

En última instancia, la síntesis del habla es la tecnología que ha revolucionado cómo se comunica la humanidad. En cierto sentido, le da al texto una vida propia. También le da al mundo la oportunidad de escuchar los pensamientos de personas brillantes que normalmente no habrían tenido voz.

OTROS IDIOMAS