商湯科技、「日日新5o」を発表:GPT-4oに匹敵するリアルタイム・ストリーミング多モーダルインタラクションを実現
2024年世界人工知能大会において、商湯科技は国内初のWYSIWYGモデル「日日新5o」を発表しました。このモデルはGPT-4oと同等のインタラクション体験を提供し、リアルタイムのストリーミング多モーダルインタラクションを実現しています。音声、テキスト、画像、ビデオなどのクロスモーダル情報を統合することで、リアルタイムでの理解と応答が可能です。例えば、スタッフの着用している胸カードを認識して会場の位置を判断したり、ぬいぐるみ犬の見た目や服装を記述したり、スタッフが手描きした絵画を即座に評価したりすることができます。