商湯科技開源多模態自主推理模型SenseNova-MARS,提供8B和32B版本。該模型是首個Agentic VLM,融合動態視覺推理與圖文搜索,能理解圖像並自主推理,推動多模態大模型發展。
商湯科技開源SenseNova-MARS模型,具備動態視覺推理與圖文搜索能力,模擬偵探邏輯實現AI自主執行。該模型含8B和32B版本,在MMSearch評測中以74.2分領先,性能超越GPT-5.2,標誌着AI從理解到執行的重要跨越。