阿里通義宣佈開源R1-Omni模型 可提升多模態情感識別能力
3月11日,通義實驗室團隊宣佈開源R1-Omni模型,爲全模態模型的發展帶來了新的突破。該模型結合了強化學習與可驗證獎勵(RLVR)方法,專注於提升多模態情感識別任務中的推理能力和泛化性能。R1-Omni的訓練分爲兩個階段。在冷啓動階段,團隊使用包含580條視頻數據的組合數據集進行微調,這些數據來自Explainable Multimodal Emotion Reasoning(EMER)數據集和HumanOmni數據集。這一階段旨在爲模型奠定基礎推理能力,確保其在進入RLVR階段前具備一定的多模態情感識別能力,從而保障後續訓練的平穩性、效率與穩定性。