英伟达在2026年GTC大会上宣布大幅扩展开源模型家族,重点推出Nemotron 3系列多模态模型。其中,Nemotron 3 Ultra基于Blackwell架构优化,吞吐量效率提升5倍,专为复杂代码辅助和企业工作流设计。同时,公司还展示了多模态交互的最新成果,旨在加速智能体、物理AI及医疗领域的创新。
英伟达发布新一代开源大模型Nemotron 3 Super,专为AI智能体设计。该模型采用创新的Mamba-MoE混合架构,参数总量1200亿,激活参数仅120亿,推理效率大幅提升,速度暴增300%,同时保持卓越任务成功率,成为开源社区焦点。
2026年AI竞赛中,“小而美”模型成为企业落地关键。亚马逊宣布英伟达Nemotron 3 Nano模型登陆其Bedrock平台,深化双方AI基础设施合作。该模型以极致性价比为核心优势,为开发者提供高效生产力工具。
英伟达发布Nemotron 3系列,融合Mamba与Transformer架构,高效处理长上下文并降低资源消耗。该系列专为自主执行复杂任务的AI代理系统设计,包含Nano、Super、Ultra三款型号。目前Nano已上市,Super和Ultra预计2026年上半年推出。
一款高效的推理与聊天大语言模型。
由NVIDIA定制的大型语言模型,提升查询回答的帮助性。
高效准确的AI语言模型
大型语言模型,支持多语言和编程语言文本生成。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Openai
$7.7
$30.8
200
Anthropic
$105
$525
$21
Alibaba
$4
$16
1k
$1
$10
256
$2
$20
-
$6
$24
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
128
Tencent
32
Deepseek
$12
bartowski
NVIDIA OpenReasoning - Nemotron - 32B的量化版本,通过llama.cpp进行量化处理,减少模型存储和计算资源需求,便于部署。