Le 8 avril 2025, NVIDIA a annoncé le lancement de son dernier grand modèle linguistique (LLM) : Llama3.1Nemotron Ultra253B. Ce modèle, basé sur Llama-3.1-405B-Instruct de Meta, a été profondément optimisé grâce à une technique innovante de recherche d'architecture neuronale (NAS). Il surpasse non seulement les modèles Behemoth et Maverick de la récente série Llama4, mais il est également publié en open source sur la plateforme Hugging Face, suscitant un vif intérêt au sein de la communauté de l'IA.

QQ_1744161895807.png

Performances révolutionnaires : surpassant Llama4 Behemoth et Maverick

Selon les informations officielles de NVIDIA et les dernières discussions sur les réseaux sociaux, Llama3.1Nemotron Ultra253B excelle dans plusieurs tests de référence clés. Ce modèle possède 253 milliards de paramètres. Comparé à Llama4 Behemoth avec ses 2 000 milliards de paramètres (288 milliards de paramètres actifs) et Maverick avec ses 17 milliards de paramètres actifs, Nemotron Ultra réalise une avancée significative en termes d'équilibre entre efficacité et performances.

Bien que les données de référence précises n'aient pas encore été entièrement publiées, Nemotron Ultra surpasserait les modèles phares de la série Llama4 en termes de capacité de raisonnement, de suivi des instructions et de traitement de tâches générales. Ceci est dû à l'optimisation de l'architecture du modèle par NVIDIA grâce à la technologie NAS, réduisant considérablement l'occupation mémoire et le délai d'inférence, tout en maintenant une haute précision. En comparaison, Llama4 Behemoth, bien que disposant d'un nombre important de paramètres, exige des ressources de calcul plus importantes. Nemotron Ultra, quant à lui, peut fonctionner efficacement sur un seul nœud avec 8 GPU H100, démontrant ainsi son avantage en termes de praticabilité.

Publication en open source : un modèle commercialement viable sur Hugging Face

Llama3.1Nemotron Ultra253B n'est pas seulement performant, mais sa stratégie open source est également saluée. Le modèle est disponible sur la plateforme Hugging Face avec des poids ouverts, sous la licence NVIDIA Open Model License et la licence communautaire Llama3.1, autorisant son utilisation commerciale.

Il est dit que Nemotron Ultra253B non seulement surpasse Llama4 Behemoth et Maverick, mais rivalise également avec DeepSeek R1, et dispose d'une licence commerciale, ce qui est incroyablement populaire ! Cette initiative est considérée comme une étape importante de NVIDIA pour promouvoir la démocratisation de l'IA, offrant aux développeurs, aux entreprises et aux chercheurs un accès facile à un modèle haute performance.

De plus, le modèle prend en charge une longueur de contexte allant jusqu'à 128 K, adapté à de nombreuses tâches telles que le raisonnement avancé, l'interaction conversationnelle, la génération améliorée par la recherche (RAG) et l'appel d'outils. NVIDIA souligne que les développeurs peuvent basculer entre les « modes d'inférence » (Reasoning On/Off) via des invites système, pour s'adapter aux besoins des différents scénarios d'application.

Il est important de noter que Llama4 Behemoth n'est pas encore entièrement publié (il est toujours en phase d'entraînement), donc une comparaison directe pourrait être incomplète. Néanmoins, Nemotron Ultra, grâce à sa nature open source et à son adaptation efficace aux clusters mono-GPU, est considéré comme un outsider majeur dans le domaine actuel de l'IA.

QQ_1744161906170.png

Le déploiement stratégique de NVIDIA

Des experts du secteur estiment que le lancement de Llama3.1Nemotron Ultra253B représente non seulement une percée technologique, mais aussi un déploiement stratégique de NVIDIA dans l'écosystème de l'IA. En optimisant les modèles open source existants et en améliorant leurs performances, NVIDIA démontre ses compétences en développement de logiciels IA et consolide la position centrale de son matériel (en particulier les GPU H100) dans l'inférence et l'entraînement de l'IA. L'avantage d'efficacité de ce modèle signifie que les entreprises peuvent déployer des solutions IA hautes performances à moindre coût, ce qui stimulera sans aucun doute la demande de matériel NVIDIA.

L'arrivée de Llama3.1Nemotron Ultra253B marque une nouvelle avancée majeure de NVIDIA dans le domaine des grands modèles linguistiques. Ses performances supérieures à celles de Llama4 Behemoth et Maverick, combinées à ses caractéristiques open source et commercialement viables, en font un point culminant de l'IA en 2025.

Accès au projet : https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b