NVIDIAはJet-Nemotron言語モデルシリーズを発表。2億・4億パラメータ版を含み、生成速度は現行最速モデル比53.6倍高速で精度も同等以上。既存モデルを再訓練せず「ポストニューラルアーキテクチャサーチ」技術で改良。....
jet-ai
Jet-Nemotron-4BはNVIDIAが開発した高効率混合アーキテクチャの言語モデルで、事後ニューラルアーキテクチャサーチとJetBlock線形注意力モジュールという2つの核心的な革新技術に基づいて構築されています。性能面では、Qwen3、Qwen2.5、Gemma3、Llama3.2などのオープンソースモデルを上回り、H100 GPU上で最大53.6倍の生成スループットの高速化を実現しています。
Jet-Nemotronは新型の混合アーキテクチャ言語モデルファミリーで、Qwen3、Qwen2.5、Gemma3、Llama3.2などの最先端のオープンソース全注意言語モデルを上回り、同時に著しい効率向上を実現します。H100 GPUでは生成スループットが最大53.6倍に加速されます。