英伟达发布Nemotron 3系列,融合Mamba与Transformer架构,高效处理长上下文并降低资源消耗。该系列专为自主执行复杂任务的AI代理系统设计,包含Nano、Super、Ultra三款型号。目前Nano已上市,Super和Ultra预计2026年上半年推出。
Nvidia近期收购开源工作负载管理系统Slurm的主要开发者SchedMD,并推出新一代开放AI模型Nemotron 3系列。此举旨在推动开源技术发展,支持高性能计算和人工智能创新。Slurm自2002年推出以来,已成为高性能计算和AI领域的重要工具。
英伟达加速构建AI生态,本周宣布收购高性能计算调度系统Slurm开发商SchedMD,并发布开源大模型家族Nemotron 3,全面押注AI智能体与物理智能。Slurm作为全球主流超算调度系统,将强化英伟达基础设施层实力。
英伟达发布小型语言模型Nemotron-Nano-9B-V2,参数量90亿,专为高效推理设计。该模型在多项基准测试中表现优异,部分测试达到同类产品最高水平,旨在与麻省理工和谷歌的小型AI模型竞争,适用于智能手表和手机等设备。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64