Nvidia a récemment annoncé que sa nouvelle microarchitecture Vera Rubin se trouve actuellement en développement et est prévue pour être lancée en 2026. La variante Rubin CPX de cette architecture sera axée sur les charges de travail d'intelligence artificielle nécessitant le traitement de très grands contextes. Le PDG de Nvidia, Jensen Huang, a déclaré lors de la conférence de presse : « La plateforme Vera Rubin marquera un nouveau bond en avant dans le calcul d'intelligence artificielle, avec le lancement d'une nouvelle génération de GPU Rubin et d'un nouveau type de processeur appelé CPX. »

Le Rubin CPX est particulièrement adapté aux scénarios d'application nécessitant le traitement de plus d'un million de tokens, tels que le développement logiciel complexe ou la génération de vidéos à haute résolution. Selon les plans de Nvidia, le GPU Vera Rubin NDL144CPX sera disponible à la fin de 2026. Le modèle CPX est spécialement conçu pour les applications nécessitant des fenêtres de contexte longues, offrant une performance d'intelligence artificielle de 8 exaflops, une capacité de calcul de contexte de 30 PF NVFP4, ainsi qu'une capacité d'opérations exponentielles trois fois supérieure à celle du système Nvidia GB300NVL72. En outre, le modèle CPX dispose de 128 Go de mémoire GDDR7, de 4 encodeurs et de 4 décodeurs, conçus spécifiquement pour la génération de vidéos, et propose un espace mémoire rapide de 100 To.

Les dirigeants de Nvidia ont indiqué que le Vera Rubin NDL144CPX peut être considéré comme une partie d'une grande usine d'intelligence artificielle. Pour soutenir la construction d'installations de centres de données à grande échelle, Nvidia prévoit également de lancer des conceptions de référence à l'échelle des gigaoctets. Cela signifie que Nvidia travaillera étroitement avec des entreprises d'infrastructure pour redéfinir les centres de données du point de vue du calcul, afin de fournir des conceptions de référence couvrant tous les aspects, y compris la conception architecturale, la simulation, l'exploitation, etc.

Avant cette publication, Nvidia a également publié les résultats les plus récents du test MLPerf inference. Le GPU Blackwell a battu un nouveau record sur ce benchmark, surpassant la base de référence du modèle d'interaction Llama3.1405B. Cette technologie innovante, appelée « service déconnecté », permet d'améliorer les performances du même matériel, offrant ainsi aux entreprises ayant déjà déployé des solutions des opportunités supplémentaires de revenus.

Points clés :  

🔍 **Nvidia lance le GPU Rubin CPX, destiné à soutenir les applications d'intelligence artificielle à grand contexte.**  

🚀 **Ce GPU sera lancé à la fin de 2026, avec une puissance d'intelligence artificielle et une configuration de mémoire importantes.**  

🏢 **Nvidia prévoit de lancer des conceptions de référence à l'échelle des gigaoctets pour les centres de données, afin d'aider à la construction d'usines d'intelligence artificielle.**