Sesame CSM
テキストと音声入力から高品質の音声を生成する、対話型音声生成モデルです。
プレミアム新製品生産性音声合成人工知能
CSMは、Sesameが開発した対話型音声生成モデルであり、テキストと音声入力に基づいて高品質の音声を生成できます。このモデルはLlamaアーキテクチャに基づいており、Mimiオーディオエンコーダーを使用しています。主に音声合成とインタラクティブな音声アプリケーション(音声アシスタントや教育ツールなど)に使用されます。CSMの主な利点は、自然で滑らかな音声を生成できること、そしてコンテキスト情報を使用して音声出力を最適化できることです。このモデルは現在オープンソースであり、研究や教育目的で使用できます。
Sesame CSM 最新のトラフィック状況
月間総訪問数
492133528
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:33