英伟达发布Llama 3.1 Nemotron Ultra 253B:性能超群的技术新标杆
2025年4月8日,英伟达推出Llama3.1Nemotron Ultra253B,这一基于Llama-3.1-405B优化的开源模型以253亿参数超越Meta的Llama4Behemoth和Maverick,成为AI领域焦点。该模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等测试中表现卓越,推理吞吐量达DeepSeek R1的四倍。通过优化训练和算法,英伟达证明高效设计可让小模型媲美巨型对手。Llama3.1Nemotron Ultra253B通过HuggingFace开放权重,并采用商业友好许可。英伟达此举不仅便利开发者,也推动了AI技术的广泛应用和生态发展。以较小参数挑战万亿级模型,该模型展现“少即是多