商汤科技开源多模态自主推理模型SenseNova-MARS,提供8B和32B版本。该模型是首个Agentic VLM,融合动态视觉推理与图文搜索,能理解图像并自主推理,推动多模态大模型发展。
商汤科技开源SenseNova-MARS模型,具备动态视觉推理与图文搜索能力,模拟侦探逻辑实现AI自主执行。该模型含8B和32B版本,在MMSearch评测中以74.2分领先,性能超越GPT-5.2,标志着AI从理解到执行的重要跨越。