英偉達在2026年GTC大會上宣佈大幅擴展開源模型家族,重點推出Nemotron 3系列多模態模型。其中,Nemotron 3 Ultra基於Blackwell架構優化,吞吐量效率提升5倍,專爲複雜代碼輔助和企業工作流設計。同時,公司還展示了多模態交互的最新成果,旨在加速智能體、物理AI及醫療領域的創新。
英偉達發佈新一代開源大模型Nemotron 3 Super,專爲AI智能體設計。該模型採用創新的Mamba-MoE混合架構,參數總量1200億,激活參數僅120億,推理效率大幅提升,速度暴增300%,同時保持卓越任務成功率,成爲開源社區焦點。
2026年AI競賽中,“小而美”模型成爲企業落地關鍵。亞馬遜宣佈英偉達Nemotron 3 Nano模型登陸其Bedrock平臺,深化雙方AI基礎設施合作。該模型以極致性價比爲核心優勢,爲開發者提供高效生產力工具。
英偉達發佈Nemotron 3系列,融合Mamba與Transformer架構,高效處理長上下文並降低資源消耗。該系列專爲自主執行復雜任務的AI代理系統設計,包含Nano、Super、Ultra三款型號。目前Nano已上市,Super和Ultra預計2026年上半年推出。
一款高效的推理與聊天大語言模型。
由NVIDIA定製的大型語言模型,提升查詢回答的幫助性。
高效準確的AI語言模型
大型語言模型,支持多語言和編程語言文本生成。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Openai
$7.7
$30.8
200
Anthropic
$105
$525
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
1k
$2
$20
-
$8
$240
52
$15.8
$12.7
64
$3.9
$15.2
Bytedance
$0.8
128
Deepseek
$12
Tencent
32
bartowski
NVIDIA OpenReasoning - Nemotron - 32B的量化版本,通過llama.cpp進行量化處理,減少模型存儲和計算資源需求,便於部署。