スピーチシンセサイザーとは何ですか?
音声シンセサイザーは、テキスト文字を人間の発話の音を近似する音に変換するために使用されるデバイスです。 個々のデバイスの洗練のレベルに応じて、生成される音はやや頑丈で人工的なサウンドであるか、実在の人の声に非常に似ている場合があります。 音声統合の概念は何世紀にもわたって存在してきましたが、ここ数十年でのみ、一般の人々がプロセスを利用できるようになりました。
11世紀にさかのぼる人間の音声パターンを人為的に生成しようとする試みの例があります。 初期の試みは、しばしば材料を使用して、人間の声帯を再現し、さまざまな種類の刺激を適用して音を生み出しました。 時間が経つにつれて、デザインは母音の発音を模倣した音を生み出すことを可能にしました。 18世紀の後半までに、いくつかのデザインが子音によく似た音を生み出すこともできました。
現代のスピーチの本当の進歩Ynthesizerは1930年代に始まりました。 Bell Laboratoriesは、ボコーダーと呼ばれるシンセサイザーを生産しました。 キーボードを使用してデータが入力され、システムによって分析され、適切な音が放出されて単語を形成しました。 単語のイントネーションと変曲はやや原始的でしたが、デバイスは明らかにわかりやすい単語を生成しました。 このデバイスの洗練されたバージョンであるVoderは、1939年の世界博覧会で一般に紹介されました。
1950年代までに、視覚的な画像を使用し、入力されたテキストが部分的に成功した結果を生み出したスピーチシンセサイザーの作業を行いました。 同時に、テクノロジーの進歩は音質を改良し始めました。 自動化された音声通信が1970年代により一般的になった頃には、人間の音声パターンに非常に近い音を生成できる音声シンセサイザーがいくつかありました。 すぐに、デバイス視覚障害のある人のために、回答機の応答や製品の読み取りに関する事前に録音されたメッセージなどの製品を生産するために使用されていました。
パーソナルコンピューターの出現は、スピーチシンセサイザーのさらなる改良のためにドアを開けました。 デバイスをホームコンピューターシステムに含めることにより、読書障害または限られたビジョンを持つ人は、さまざまなコンピュータープログラムを使用して楽しむことができます。 今日、スピーチシンセサイザーのほとんどのモデルの音声品質は、20世紀初頭に作成されたデバイスによって生成されたロボットサウンドからはほど遠いものです。 今日の多くのバージョンは、人間のスピーチとほとんど区別できない音声パターンを作成できます。