Maya Researchが発表したMaya1テキストから音声への変換モデルは、30億パラメータを備え、単一のGPUでリアルタイムで動作可能です。このモデルは自然言語の説明およびテキスト入力に基づき、制御可能な表現力豊かな音声を生成し、年齢や訛り、またはキャラクターの特徴などを指定して人間の感情と声の詳細を正確に模倣します。