Nvidia lance une nouvelle puce GPU Rubin CPX pour aider les applications d'intelligence artificielle à grande échelle

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Sep 10, 2025

Nvidia a récemment annoncé que sa nouvelle microarchitecture Vera Rubin se trouve actuellement en développement et est prévue pour être lancée en 2026. La variante Rubin CPX de cette architecture sera axée sur les charges de travail d'intelligence artificielle nécessitant le traitement de très grands contextes. Le PDG de Nvidia, Jensen Huang, a déclaré lors de la conférence de presse : « La plateforme Vera Rubin marquera un nouveau bond en avant dans le calcul d'intelligence artificielle, avec le lancement d'une nouvelle génération de GPU Rubin et d'un nouveau type de processeur appelé CPX. »

Le Rubin CPX est particulièrement adapté aux scénarios d'application nécessitant le traitement de plus d'un million de tokens, tels que le développement logiciel complexe ou la génération de vidéos à haute résolution. Selon les plans de Nvidia, le GPU Vera Rubin NDL144CPX sera disponible à la fin de 2026. Le modèle CPX est spécialement conçu pour les applications nécessitant des fenêtres de contexte longues, offrant une performance d'intelligence artificielle de 8 exaflops, une capacité de calcul de contexte de 30 PF NVFP4, ainsi qu'une capacité d'opérations exponentielles trois fois supérieure à celle du système Nvidia GB300NVL72. En outre, le modèle CPX dispose de 128 Go de mémoire GDDR7, de 4 encodeurs et de 4 décodeurs, conçus spécifiquement pour la génération de vidéos, et propose un espace mémoire rapide de 100 To.

Les dirigeants de Nvidia ont indiqué que le Vera Rubin NDL144CPX peut être considéré comme une partie d'une grande usine d'intelligence artificielle. Pour soutenir la construction d'installations de centres de données à grande échelle, Nvidia prévoit également de lancer des conceptions de référence à l'échelle des gigaoctets. Cela signifie que Nvidia travaillera étroitement avec des entreprises d'infrastructure pour redéfinir les centres de données du point de vue du calcul, afin de fournir des conceptions de référence couvrant tous les aspects, y compris la conception architecturale, la simulation, l'exploitation, etc.

Avant cette publication, Nvidia a également publié les résultats les plus récents du test MLPerf inference. Le GPU Blackwell a battu un nouveau record sur ce benchmark, surpassant la base de référence du modèle d'interaction Llama3.1405B. Cette technologie innovante, appelée « service déconnecté », permet d'améliorer les performances du même matériel, offrant ainsi aux entreprises ayant déjà déployé des solutions des opportunités supplémentaires de revenus.

Points clés :
🔍 **Nvidia lance le GPU Rubin CPX, destiné à soutenir les applications d'intelligence artificielle à grand contexte.**
🚀 **Ce GPU sera lancé à la fin de 2026, avec une puissance d'intelligence artificielle et une configuration de mémoire importantes.**
🏢 **Nvidia prévoit de lancer des conceptions de référence à l'échelle des gigaoctets pour les centres de données, afin d'aider à la construction d'usines d'intelligence artificielle.**

VeraRubin RubinCPX Nvidia PerformanceIA

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

Qualcomm a lancé deux puces pour l'inférence AI en cloud, l'AI200 et l'AI250, qui seront commercialisées en 2026 et 2027. Cela marque une transition vers l'infrastructure complète d'IA, passant des puces pour terminaux à l'ensemble de l'infrastructure d'IA. Cette nouvelle a fait bondir les actions de plus de 20 % en une seule journée, soit la plus grande hausse depuis 2019. Contrairement à la stratégie globale de NVIDIA, Qualcomm se concentre sur le marché de l'inférence des grands modèles, mettant en avant son avantage en termes d'efficacité énergétique et de coût.

Oct 29, 2025

140

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Lors de la conférence GTC 2025, NVIDIA a présenté le « projet de conception Omniverse DSX », destiné spécifiquement aux centres de données AI de plusieurs milliards de watts. Ce projet est appelé l'« usine IA ». Cette solution repose sur le cadre Omniverse et prend en charge des configurations allant d'un à dix milliards de watts. Elle vise à former et à exécuter efficacement des modèles AI de grande taille, répondant ainsi à la croissance continue des besoins en calcul IA, représentant une avancée majeure dans les infrastructures d'intelligence artificielle.

Oct 29, 2025

200

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le PDG de Nvidia, Huang Renxun, a rejeté lors du congrès GTC à Washington la thèse d'une bulle sur le marché de l'intelligence artificielle. Il prévoit que les nouvelles puces Blackwell et Rubin généreront 500 milliards de dollars de revenus au cours des prochains trimestres, poussant l'entreprise dans une période de croissance sans précédent. C'est la première fois que Nvidia organise cet événement dans la capitale américaine.

Oct 29, 2025

NVIDIA ouvre le code d'OmniVinci, un modèle de compréhension multimodale, avec seulement 1/6 des données d'entraînement

NVIDIA présente le modèle de compréhension multimodale OmniVinci, qui dépasse les modèles de pointe de 19,05 points sur plusieurs tests de référence. Ce modèle utilise seulement 0,2 trillion de tokens d'entraînement, sa performance en termes de données est six fois supérieure à celle de ses concurrents. Il vise à réaliser une compréhension unifiée du visuel, de l'audio et du texte, et à faire progresser les capacités de cognition multimodale des machines.

Oct 28, 2025

NVIDIA lance le modèle d'interprétation multimodale OmniVinci, battant le SOTA de 19,05 points

NVIDIA a dévoilé le modèle d'interprétation multimodale OmniVinci, qui dépasse les modèles de pointe de 19,05 points dans les tests standardisés, et obtient des performances exceptionnelles avec seulement 1/6 des données d'entraînement. Ce modèle vise à permettre aux systèmes d'IA de comprendre simultanément l'image, le son et le texte, imitant la perception sensorielle humaine multi-sensorielle.

Oct 28, 2025

Qualcomm lance un nouveau processeur AI, défiant une hausse de 20 % des actions NVIDIA

Qualcomm lance les puces AI200 et AI250 pour concurrencer Nvidia. L'AI200 optimise l'inférence IA avec 768 Go de mémoire, réduisant les coûts et améliorant les performances pour les grands modèles linguistiques et multimodaux.....

Oct 28, 2025

NVIDIA vendra le superordinateur personnel AI DGX Spark au prix de 3999 dollars

NVIDIA vendra le superordinateur personnel AI DGX Spark à partir du 15 octobre, au prix de 3999 dollars. Cet appareil est petit et peut être placé sur un bureau. Il dispose d'une puissance de calcul importante, idéal pour l'entraînement et la recherche de modèles d'intelligence artificielle. Les utilisateurs peuvent l'acheter via le site officiel et les partenaires aux États-Unis, ciblant les scientifiques des données et les chercheurs en IA.

Oct 14, 2025

180

La supercalculatrice IA personnelle NVIDIA DGX Spark sera commercialisée ce mercredi : l'intelligence artificielle entre dans l'ère du bureau

La première supercalculatrice IA personnelle de NVIDIA, le DGX Spark, sera en vente cette semaine. Son puissant traitement permet de gérer des modèles d'IA complexes et son petit format convient parfaitement à un bureau. À partir du 15 octobre, vous pourrez passer commande en ligne sur le site officiel ou acheter via des canaux désignés aux États-Unis. Le prix officiel a été ajusté de 3 000 dollars à 3 999 dollars.

Oct 14, 2025

130

OpenAI et Microsoft concluent un accord important : la structure du capital change à nouveau, les investisseurs font face au risque d'effet de dilution

Les récents échanges d'OpenAI ont complexifié sa structure du capital, et les investisseurs sont sceptiques quant aux rendements. La valeur de l'entreprise atteint 500 milliards de dollars, lui conférant le statut de société non cotée la plus précieuse au monde, principalement grâce à des contrats sur des puces d'un montant de plusieurs milliards de dollars avec NVIDIA et AMD, les fonds seront utilisés pour atteindre l'objectif de déploiement d'une capacité de calcul de l'ordre de 1 000 milliards de dollars.

Oct 13, 2025

100

Musk embauche l'équipe centrale de NVIDIA pour xAI et accélère le développement du modèle du monde

xAI, société d'Elon Musk, accélère le développement d'un 'modèle mondial' pour l'AGI, recrutant deux chercheurs clés de Nvidia.....

Oct 13, 2025

130

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Nvidia lance une nouvelle puce GPU Rubin CPX pour aider les applications d'intelligence artificielle à grande échelle

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

NVIDIA ouvre le code d'OmniVinci, un modèle de compréhension multimodale, avec seulement 1/6 des données d'entraînement

NVIDIA lance le modèle d'interprétation multimodale OmniVinci, battant le SOTA de 19,05 points

Qualcomm lance un nouveau processeur AI, défiant une hausse de 20 % des actions NVIDIA

NVIDIA vendra le superordinateur personnel AI DGX Spark au prix de 3999 dollars

La supercalculatrice IA personnelle NVIDIA DGX Spark sera commercialisée ce mercredi : l'intelligence artificielle entre dans l'ère du bureau

OpenAI et Microsoft concluent un accord important : la structure du capital change à nouveau, les investisseurs font face au risque d'effet de dilution

Musk embauche l'équipe centrale de NVIDIA pour xAI et accélère le développement du modèle du monde

Recommandations d'actualités IA connexes

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

NVIDIA ouvre le code d'OmniVinci, un modèle de compréhension multimodale, avec seulement 1/6 des données d'entraînement

NVIDIA lance le modèle d'interprétation multimodale OmniVinci, battant le SOTA de 19,05 points

Qualcomm lance un nouveau processeur AI, défiant une hausse de 20 % des actions NVIDIA

NVIDIA vendra le superordinateur personnel AI DGX Spark au prix de 3999 dollars

La supercalculatrice IA personnelle NVIDIA DGX Spark sera commercialisée ce mercredi : l'intelligence artificielle entre dans l'ère du bureau

OpenAI et Microsoft concluent un accord important : la structure du capital change à nouveau, les investisseurs font face au risque d'effet de dilution

Musk embauche l'équipe centrale de NVIDIA pour xAI et accélère le développement du modèle du monde

GEO Services