英偉達發佈Llama 3.1 Nemotron Ultra 253B:性能超羣的技術新標杆
2025年4月8日,英偉達推出Llama3.1Nemotron Ultra253B,這一基於Llama-3.1-405B優化的開源模型以253億參數超越Meta的Llama4Behemoth和Maverick,成爲AI領域焦點。該模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等測試中表現卓越,推理吞吐量達DeepSeek R1的四倍。通過優化訓練和算法,英偉達證明高效設計可讓小模型媲美巨型對手。Llama3.1Nemotron Ultra253B通過HuggingFace開放權重,並採用商業友好許可。英偉達此舉不僅便利開發者,也推動了AI技術的廣泛應用和生態發展。以較小參數挑戰萬億級模型,該模型展現“少即是多