アリババ通義、R1-Omniモデルをオープンソース化 多モーダル感情認識能力向上
3月11日、通義实验室チームはR1-Omniモデルのオープンソース化を発表し、全モーダルモデルの発展に新たなブレークスルーをもたらしました。このモデルは強化学習と検証可能な報酬(RLVR)手法を組み合わせ、多モーダル感情認識タスクにおける推論能力と汎化性能の向上に重点を置いています。R1-Omniのトレーニングは2段階で行われます。コールドスタート段階では、Explainable Multimodal Emotioから取得した580本のビデオデータを含む複合データセットを使用して微調整が行われます。