NVIDIA發佈Jet-Nemotron語言模型系列,含2億和4億參數版本。生成速度比當前最優模型快53.6倍,準確性相當或更高。突破來自"後神經架構搜索"技術,改造現有預訓練模型而非重新訓練。
jet-ai
Jet-Nemotron-4B是NVIDIA推出的高效混合架構語言模型,基於後神經架構搜索和JetBlock線性注意力模塊兩大核心創新構建,在性能上超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等開源模型,同時在H100 GPU上實現了最高53.6倍的生成吞吐量加速。
Jet-Nemotron是一個新型混合架構語言模型家族,超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等最先進的開源全注意力語言模型,同時實現了顯著的效率提升——在H100 GPU上生成吞吐量最高可達53.6倍加速。