Sesame、CSMモデルを発表:リアルタイム感情カスタマイズAI音声合成が新たな高みに
3月13日、Sesame社は最新のテキスト音声変換モデルCSMを発表し、業界の注目を集めています。公式発表によると、CSMはエンドツーエンドのTransformerベースのマルチモーダル学習アーキテクチャを採用し、コンテキスト情報を理解して、自然で感情豊かな音声、まるで人間の声のような驚くほどリアルな音声を生成します。このモデルはリアルタイム音声生成に対応し、テキストと音声の両方の入力を処理できます。ユーザーはパラメーターを調整することで、トーン、イントネーション、リズム、感情などの特性を制御でき、高い柔軟性を発揮します。CSMはAI音声技術の...