モデルトーカーとは何ですか?

モデルトーカーは、コンピューターと人の自然な声を使用して、英語のテキストをスピーチに変換し、できるだけ密接に自然なスピーチを模倣します。モデルトーカーは、声を失っているが自然なスピーチの資質を保持したい人に特に役立つように設計された新世代のソフトウェアアプリケーションの1つです。同社は2008年にベータ版をテストしていました。

は、オープンマーケットで入手できたら、ALSなどの音声阻害疾患を持つ人々がコミュニケーションする方法に革命をもたらすことを約束します。彼らは外の世界とコミュニケーションをとろうとする別の代替手段を提供し、それは彼らの自然な声でそうするでしょう。これに対する唯一の制限は、モデルトーカーTTSシステムが、声がまだ良好な状態にある間に最初の録音を行う場合にのみ機能することです。

モデルトーカーと合成された音声を設定したい人は、数時間のオーディオを記録する必要があります。多くのcomMonフレーズは記録されますが、システムはさまざまなボーカルサウンドを組み合わせて一致させて単語を作成します。これらの個々の音はフォネムと呼ばれます。正確なフレーズが記録されていない場合でも、Text to Phoneme機能は、実際の単語を記録している単語よりも多くの単語を作成するのに役立ちます。

市場には他の音声シンセサイザーがいますが、モデルの話者の大きな利点は、ユーザーの音声がモデルとして機能することです。一部の人にとって、彼らの声は彼らのアイデンティティの重要な部分であり、彼らはその部分をそのままにしたいと思っています。モデルトーカーは、ユーザーがそれを行うことを許可する先駆者です。

モデルトーカーの合成音声は、コンピューターで、またはSAPI 5.1標準でサポートされている音声生成デバイスで使用できます。ある時点で、Windowsモバイルシステムを使用してスマートフォンで製品を利​​用できる可能性もあります。

ソフトウェアがテキストに大きな進歩を遂げています音声システムに対して、モデルの話者にはいくつかの明確な制限があります。最も顕著なのは、音の品質自体にあるかもしれません。合成された音声はユーザーの特定の音を持っているかもしれませんが、それでもやや厄介でロボットに聞こえます。モデルトーカーは、より自然なサウンドの合成声が使用されていることを認めていますが、これらは最適なスタジオ条件下でさらに多くの録音を必要とすることがよくあります。同社は、そのソフトウェアは大規模な商用製品と同じくらい洗練されていると主張しています。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?