Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil MCP

NVIDIA lance Llama 3.1 Nemotron Ultra 253B, surpassant Llama 4 Behemoth en performances

AIbase基地

Publié leActualités IA · 7 minutes de lecture · Apr 9, 2025

Le 8 avril 2025, NVIDIA a annoncé le lancement de son dernier grand modèle linguistique (LLM) : Llama3.1Nemotron Ultra253B. Ce modèle, basé sur Llama-3.1-405B-Instruct de Meta, a été profondément optimisé grâce à une technique innovante de recherche d'architecture neuronale (NAS). Il surpasse non seulement les modèles Behemoth et Maverick de la récente série Llama4, mais il est également publié en open source sur la plateforme Hugging Face, suscitant un vif intérêt au sein de la communauté de l'IA.

Performances révolutionnaires : surpassant Llama4 Behemoth et Maverick

Selon les informations officielles de NVIDIA et les dernières discussions sur les réseaux sociaux, Llama3.1Nemotron Ultra253B excelle dans plusieurs tests de référence clés. Ce modèle possède 253 milliards de paramètres. Comparé à Llama4 Behemoth avec ses 2 000 milliards de paramètres (288 milliards de paramètres actifs) et Maverick avec ses 17 milliards de paramètres actifs, Nemotron Ultra réalise une avancée significative en termes d'équilibre entre efficacité et performances.

Bien que les données de référence précises n'aient pas encore été entièrement publiées, Nemotron Ultra surpasserait les modèles phares de la série Llama4 en termes de capacité de raisonnement, de suivi des instructions et de traitement de tâches générales. Ceci est dû à l'optimisation de l'architecture du modèle par NVIDIA grâce à la technologie NAS, réduisant considérablement l'occupation mémoire et le délai d'inférence, tout en maintenant une haute précision. En comparaison, Llama4 Behemoth, bien que disposant d'un nombre important de paramètres, exige des ressources de calcul plus importantes. Nemotron Ultra, quant à lui, peut fonctionner efficacement sur un seul nœud avec 8 GPU H100, démontrant ainsi son avantage en termes de praticabilité.

Publication en open source : un modèle commercialement viable sur Hugging Face

Llama3.1Nemotron Ultra253B n'est pas seulement performant, mais sa stratégie open source est également saluée. Le modèle est disponible sur la plateforme Hugging Face avec des poids ouverts, sous la licence NVIDIA Open Model License et la licence communautaire Llama3.1, autorisant son utilisation commerciale.

Il est dit que Nemotron Ultra253B non seulement surpasse Llama4 Behemoth et Maverick, mais rivalise également avec DeepSeek R1, et dispose d'une licence commerciale, ce qui est incroyablement populaire ! Cette initiative est considérée comme une étape importante de NVIDIA pour promouvoir la démocratisation de l'IA, offrant aux développeurs, aux entreprises et aux chercheurs un accès facile à un modèle haute performance.

De plus, le modèle prend en charge une longueur de contexte allant jusqu'à 128 K, adapté à de nombreuses tâches telles que le raisonnement avancé, l'interaction conversationnelle, la génération améliorée par la recherche (RAG) et l'appel d'outils. NVIDIA souligne que les développeurs peuvent basculer entre les « modes d'inférence » (Reasoning On/Off) via des invites système, pour s'adapter aux besoins des différents scénarios d'application.

Il est important de noter que Llama4 Behemoth n'est pas encore entièrement publié (il est toujours en phase d'entraînement), donc une comparaison directe pourrait être incomplète. Néanmoins, Nemotron Ultra, grâce à sa nature open source et à son adaptation efficace aux clusters mono-GPU, est considéré comme un outsider majeur dans le domaine actuel de l'IA.

Le déploiement stratégique de NVIDIA

Des experts du secteur estiment que le lancement de Llama3.1Nemotron Ultra253B représente non seulement une percée technologique, mais aussi un déploiement stratégique de NVIDIA dans l'écosystème de l'IA. En optimisant les modèles open source existants et en améliorant leurs performances, NVIDIA démontre ses compétences en développement de logiciels IA et consolide la position centrale de son matériel (en particulier les GPU H100) dans l'inférence et l'entraînement de l'IA. L'avantage d'efficacité de ce modèle signifie que les entreprises peuvent déployer des solutions IA hautes performances à moindre coût, ce qui stimulera sans aucun doute la demande de matériel NVIDIA.

L'arrivée de Llama3.1Nemotron Ultra253B marque une nouvelle avancée majeure de NVIDIA dans le domaine des grands modèles linguistiques. Ses performances supérieures à celles de Llama4 Behemoth et Maverick, combinées à ses caractéristiques open source et commercialement viables, en font un point culminant de l'IA en 2025.

Accès au projet : https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b

Llama3.1NemotronUltra253B Grandmodèlelinguistique(LLM)Recherched'architectureneuronale(NAS)Nvidia

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily