Cartesia社が音声AIエージェントSonic-3を発表しました。世界一速く自然なリアルタイム会話モデルと称しています。新たな状態空間モデルアーキテクチャにより、ほぼゼロに近い遅延のインタラクションを実現し、人の感情やトーン、笑いの変化を模倣できるため、会話の臨場感を大きく向上させます。
笑いと感情を含むリアルタイムのテキストから音声への変換。