A Nvidia anunciou recentemente que sua nova arquitetura Vera Rubin está em desenvolvimento e planejada para ser lançada em 2026. A variante Rubin CPX dessa arquitetura será focada em atender cargas de trabalho de inteligência artificial que exigem o processamento de grandes janelas de contexto. O CEO da Nvidia, Jensen Huang, disse em uma coletiva de imprensa: "A plataforma Vera Rubin marcará um salto adiante na computação de inteligência artificial, com o lançamento de uma nova geração de GPUs Rubin e de um novo tipo de processador chamado CPX."

O Rubin CPX é especialmente adequado para aplicações que exigem o processamento de mais de um milhão de tokens, como desenvolvimento de software complexo e geração de vídeos de alta resolução. De acordo com os planos da Nvidia, a GPU Vera Rubin NDL144CPX estará disponível no final de 2026. Os modelos CPX foram projetados especificamente para aplicações que exigem janelas de contexto longas, oferecendo desempenho de inteligência artificial de 8 exaflops, capacidade de cálculo de contexto de 30 PF NVFP4, e três vezes a capacidade de operações exponenciais em comparação ao sistema Nvidia GB300NVL72. Além disso, os modelos CPX contam com 128 GB de memória GDDR7, 4 codificadores e 4 decodificadores, projetados especificamente para geração de vídeo, e oferecem 100 TB de memória rápida.

Os executivos da Nvidia afirmaram que a Vera Rubin NDL144CPX pode ser considerada parte de uma fábrica de inteligência artificial de grande porte. Para apoiar a construção de centros de dados em larga escala, a Nvidia também planeja lançar um projeto de referência de escala gigabit. Isso significa que a Nvidia trabalhará de perto com empresas de infraestrutura para redesenhar os centros de dados do ponto de vista computacional, fornecendo projetos de referência que abrangem áreas como construção, design, simulação e operação.

Antes deste lançamento, a Nvidia também divulgou os resultados mais recentes dos testes MLPerf de inferência. A GPU Blackwell bateu um novo recorde nesse benchmark, superando a base da modelo Llama3.1405B. Essa tecnologia inovadora é chamada de "serviço desacoplado" e permite que o mesmo hardware tenha melhor desempenho, trazendo oportunidades adicionais de receita para empresas que já possuem soluções implantadas.

Principais pontos:

🔍 **A Nvidia lançou a GPU Rubin CPX, projetada para suportar aplicações de IA com grandes janelas de contexto.**

🚀 **Essa GPU será lançada no final de 2026, com desempenho e configuração de memória poderosos.**

🏢 **A Nvidia planeja lançar um projeto de referência de escala gigabit para centros de dados, ajudando na construção de fábricas de IA.**