商湯科技開源多模態自主推理模型SenseNova-MARS,提供8B和32B版本。該模型是首個Agentic VLM,融合動態視覺推理與圖文搜索,能理解圖像並自主推理,推動多模態大模型發展。
商湯科技開源SenseNova-MARS模型,具備動態視覺推理與圖文搜索能力,模擬偵探邏輯實現AI自主執行。該模型含8B和32B版本,在MMSearch評測中以74.2分領先,性能超越GPT-5.2,標誌着AI從理解到執行的重要跨越。
阿里雲通義智能硬件展上,商湯科技推出的“元蘿蔔”機器人引人注目,它不僅能下棋,還能進行擬人化教學和實時對話,爲孩子們提供輕鬆有趣的學習體驗。
商湯科技發佈Seko2.0,全球首個專注多集視頻生成的AI智能體,實現從單片段到連續敘事的跨越。該系統能保持角色、場景、風格高度一致,在劇情連貫性、人物穩定性和視覺統一性上取得突破,爲短劇、廣告、教育等領域提供可規模化的AI內容生產方案,基於自研“日日新Seko”多模態大模型。
Openai
$7.7
輸入tokens/百萬
$30.8
輸出tokens/百萬
200
上下文長度
$8.75
$70
400
Xai
$21
$105
256
Baidu
-
32
Sensetime
$3
$9
128
$8
$32
$1.5
$4.5
Minimax
internlm
InternLM-20B是由上海人工智能實驗室聯合商湯科技、香港中文大學和復旦大學發佈的200億參數預訓練模型,在超過2.3T高質量中英文及代碼token數據上進行預訓練,具備卓越的綜合性能和強大的工具調用能力。