AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

NVIDIA 推出 Jet-Nemotron:53 倍提速的混合架構語言模型實現 98% 的推理成本節約

NVIDIA發佈Jet-Nemotron語言模型系列,含2億和4億參數版本。生成速度比當前最優模型快53.6倍,準確性相當或更高。突破來自"後神經架構搜索"技術,改造現有預訓練模型而非重新訓練。

12.9k 7 小時前
NVIDIA 推出 Jet-Nemotron:53 倍提速的混合架構語言模型實現 98% 的推理成本節約

模型

查看更多

Jet Nemotron 4B

jet-ai

J

Jet-Nemotron-4B是NVIDIA推出的高效混合架構語言模型,基於後神經架構搜索和JetBlock線性注意力模塊兩大核心創新構建,在性能上超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等開源模型,同時在H100 GPU上實現了最高53.6倍的生成吞吐量加速。

自然語言處理TransformersTransformers英語
jet-ai
208
2

Jet Nemotron 2B

jet-ai

J

Jet-Nemotron是一個新型混合架構語言模型家族,超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等最先進的開源全注意力語言模型,同時實現了顯著的效率提升——在H100 GPU上生成吞吐量最高可達53.6倍加速。

自然語言處理TransformersTransformers英語
jet-ai
9.3k
15
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖