英偉達發佈Nemotron 3系列,融合Mamba與Transformer架構,高效處理長上下文並降低資源消耗。該系列專爲自主執行復雜任務的AI代理系統設計,包含Nano、Super、Ultra三款型號。目前Nano已上市,Super和Ultra預計2026年上半年推出。
Nvidia近期收購開源工作負載管理系統Slurm的主要開發者SchedMD,並推出新一代開放AI模型Nemotron 3系列。此舉旨在推動開源技術發展,支持高性能計算和人工智能創新。Slurm自2002年推出以來,已成爲高性能計算和AI領域的重要工具。
英偉達加速構建AI生態,本週宣佈收購高性能計算調度系統Slurm開發商SchedMD,併發布開源大模型家族Nemotron 3,全面押注AI智能體與物理智能。Slurm作爲全球主流超算調度系統,將強化英偉達基礎設施層實力。
英偉達發佈小型語言模型Nemotron-Nano-9B-V2,參數量90億,專爲高效推理設計。該模型在多項基準測試中表現優異,部分測試達到同類產品最高水平,旨在與麻省理工和谷歌的小型AI模型競爭,適用於智能手錶和手機等設備。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1