アマゾンのAGIチームが、これまでで最大のパラメータ数と最大のトレーニングデータセットを持つ、史上最大のテキスト音声変換モデルを発表しました。チームは、学習した知識を応用することで、人間の音声品質を向上させたいと考えています。新しいモデルの名前はBASE TTSで、980億個のパラメータを持ち、10万時間の録音データを使用してトレーニングされました。チームは、BASE TTSを学習アプリケーションに使用し、テキスト音声変換アプリケーションの人間の音声品質を向上させる計画です。