阿里發佈多模態推理模型QVQ-72B!視覺、語言能力雙提升,複雜問題迎刃而解
阿里巴巴近日推出了一款名爲QVQ-72B的全新多模態推理模型,該模型基於Qwen2-VL-72B構建,融合了強大的語言和視覺能力,能夠處理更爲複雜的推理和分析任務,標誌着阿里巴巴在多模態AI領域取得了新的突破。QVQ-72B在視覺推理、數學和科學問題上表現出了顯著的提升,尤其是在多步推理任務中。這意味着該模型不僅能夠理解文字信息,還能理解圖像信息,並通過多步推理來解決複雜問題,這是傳統AI模型難以企及的。該模型的一大亮點是其在物理問題中結合文字和視覺信息推導因果關係的能