Qu'est-ce que la synthèse vocale?

La synthèse vocale est un processus dans lequel la communication verbale est répliquée à l'aide d'un appareil artificiel. Un ordinateur qui convertit le texte en parole est un type de synthétiseur de parole.

Les premières formes de synthèse de la parole ont été mises en œuvre à l'aide de machines conçues pour fonctionner comme le conduit vocal humain. La machine à parler créée par Wolfgang von Kempelen dans les années 1700 en est un exemple. Avec ce dispositif, la parole était produite à travers un soufflet de cuisine, une anche de cornemuse et une cloche de clarinette. Le soufflet de la cuisine était conçu pour agir comme un poumon, tandis que la glotte (la zone des cordes vocales) était représentée à travers le roseau de cornemuse. La cloche de clarinette a servi de bouche.

Le fonctionnement de l'appareil était complètement manuel. La main droite contrôlait une série de leviers tandis que la main gauche manipulait la cloche de clarinette (bouche). Il y avait aussi la possibilité de boucher les "narines" pour produire un son moins nasal. Dans les deux cas, tant que les commandes de base ont été correctement utilisées, la machine reçoit un flux d’air. Ce flux d'air a déterminé les types de sons qui seraient produits.

Les machines à parler subséquentes des 18e et 19e siècles ont conservé cette configuration, bien que des améliorations aient été apportées. Par exemple, à la fin du XIXe siècle, Joseph Faber a créé une machine à parler pouvant recevoir des entrées via un clavier et une pédale. La machine était également très créative, le son étant sorti à travers un «visage» artificiel.

À la veille du XXe siècle, les innovations en électronique ont permis à la synthèse vocale de prendre une direction encore plus puissante. Bien que le principe consistant à imiter le conduit vocal humain soit toujours le même, les machines à parler du début du XXe siècle pouvaient produire de meilleurs sons grâce à une entrée plus précise.

Cependant, ce n’est que jusqu’à l’avènement des ordinateurs que la synthèse vocale a pu être utilisée en dehors du domaine du divertissement. Cela est principalement dû au fait que les synthétiseurs vocaux pourraient être stockés dans un logiciel plutôt que sur une machine séparée. De plus, avec l’aide des ordinateurs, la synthèse vocale pourrait revêtir une forme différente; en utilisant des voix humaines comme source principale de son.

Cette forme de synthèse de la parole est appelée concaténative. Le processus fonctionne en connectant différents enregistrements de la parole humaine. Le son obtenu est beaucoup plus naturel et agréable à l'oreille. Cela contraste avec les programmes qui utilisent la synthèse articulatoire, où la parole est reproduite à l'aide d'un modèle informatisé du tractus vocal.

Les synthétiseurs de parole commerciaux peuvent utiliser des méthodes concaténatives ou articulatoires, mais ils sont tous deux capables d'atteindre le même objectif. être capable de donner aux gens l'occasion d'entendre un texte. Ceci est particulièrement utile dans les situations où la lecture est importune ou impossible.

Dans le monde des affaires, de telles situations sont très courantes, en particulier pour les transactions téléphoniques. Sans solutions de synthèse vocale, les propriétaires d'entreprise devraient dépenser de l'argent pour recruter encore plus de personnel de service clientèle. Les solutions synthétisées évitent ce problème car tout se fait par ordinateur; pas un être humain.

La parole synthétisée joue également un rôle dans la vie quotidienne, en particulier chez les personnes handicapées. Parler des horloges, des dictionnaires et d’autres appareils peut faciliter la tâche des personnes qui ont du mal à voir ou à lire. La synthèse vocale est même capable de donner la parole à des personnes qui ne peuvent pas parler du tout. Steven Hawking, un physicien célèbre, en est un exemple marquant. Depuis que la maladie de Lou Gehrig l'a rendu muet, Hawking utilise un synthétiseur vocal pour communiquer avec les gens.

Des applications TTS sont également disponibles pour aider les utilisateurs dans diverses activités informatiques. Pour obtenir ces types d’applications, la plupart des utilisateurs devront acheter des logiciels distincts ou télécharger des correctifs. Cette dernière option est généralement gratuite, en fonction du système d'exploitation ou du programme de traitement de texte utilisé. Cependant, si une personne décidait d'acheter un logiciel séparé, elle pourrait avoir accès à un système de meilleure qualité. Des exemples spécifiques sont disponibles dans Natural Reader 7 et Text Aloud 2.

En définitive, la synthèse vocale est une technologie qui a révolutionné la manière dont l’humanité communique. En un sens, cela donne une vie propre au texte. Cela donne également au monde l'occasion d'entendre les pensées de brillants individus qui n'auraient normalement pas de voix.

DANS D'AUTRES LANGUES

Cet article vous a‑t‑il été utile ? Merci pour les commentaires Merci pour les commentaires

Comment pouvons nous aider? Comment pouvons nous aider?