Model Talkerとは何ですか?
Model Talkerは、コンピューターと録音者の自然な音声を使用して、自然な音声を可能な限り模倣して、英語のテキストを音声に変換します。 Model Talkerは、音声を失いながらも自然な音声の品質を維持したい人に特に役立つように設計された新世代のソフトウェアアプリケーションの1つです。 同社は2008年にベータ版をテストしていました。
Model Talkerは、公開市場で入手可能になると、ALSなどの発語抑制疾患を持つ人々のコミュニケーション方法に革命をもたらすことを約束します。 彼らが外の世界と通信しようとするとき、それは別の選択肢を提供し、彼らの自然な声でそうします。 これに対する唯一の制限は、モデルトーカーTTSシステムが、音声がまだ良好な状態で最初に録音を行った場合にのみ機能することです。
モデルトーカーで合成音声を設定する場合は、何時間も音声を録音する必要があります。 多くの一般的なフレーズが録音されますが、システムは異なるボーカルサウンドをミックスして一致させ、単語を作成します。 これらの個々の音は音素と呼ばれます。 正確なフレーズが録音されていなくても、テキストから音素への変換機能は、録音されている実際の単語よりも多くの単語を作成するのに役立ちます。
市場には他の音声シンセサイザーもありますが、Model Talkerの大きな利点は、ユーザーの音声がモデルとして機能することです。 一部の人にとって、彼らの声は彼らのアイデンティティの重要な部分であり、彼らは彼らのその部分をそのままにしておきたい。 Model Talkerは、ユーザーがそれを行えるようにする先駆者です。
Model Talker合成音声は、コンピューターで使用することも、SAPI 5.1標準でサポートされる音声生成デバイスで使用することもできます。 ある時点で、この製品はWindows Mobileシステムを搭載したスマートフォンでも使用できるようになります。
このソフトウェアはテキストから音声へのシステムを大きく進歩させましたが、モデルトーカーには明確な制限がいくつかあります。 最も顕著なのは、音声の品質そのものです。 合成された音声にはユーザー固有の音が含まれている場合がありますが、それでもやや厄介でロボットのように聞こえます。 Model Talkerは、より自然な響きの合成音声が使用されていることを認識していますが、最適なスタジオの条件下では多くの場合録音に時間がかかることに注意してください。 同社は、ソフトウェアがより大きな商用製品と同じくらい洗練されていると主張しています。