バイトダンス豆包音声モデルとビジョンモデルがアップグレード、総合能力が20.3%向上
2024年8月21日開催の火山引擎AIイノベーションツアー上海会場において、火山引擎は豆包大規模言語モデルの全面的なアップグレードを発表しました。これには、豆包・テキスト生成画像モデルによる長文テキストのより正確な画像マッチング機能、複数の公開テストセットにおける豆包・音声認識モデルのエラー率最大40%の削減、そして豆包・音声合成モデルへのリアルタイム対応と正確な句読点付与が可能なストリーミング音声合成機能の追加が含まれます。火山引擎はまた、豆包大規模言語モデルとリアルタイムの音声ビデオ技術を統合した対話型AIリアルタイムインタラクションソリューションを発表し、エンドツーエンドの...