El 8 de abril de 2025, NVIDIA anunció el lanzamiento de su último modelo de lenguaje grande (LLM): Llama3.1Nemotron Ultra253B. Este modelo, basado en Llama-3.1-405B-Instruct de Meta, se ha optimizado profundamente mediante la innovadora técnica de búsqueda de arquitectura neuronal (NAS). No solo supera en rendimiento a los modelos Behemoth y Maverick de la reciente serie Llama4, sino que también se ha lanzado como código abierto en la plataforma Hugging Face, generando un gran interés en la comunidad de IA.

QQ_1744161895807.png

Rendimiento excepcional: Superando a Llama4 Behemoth y Maverick

Según la información oficial de NVIDIA y los últimos debates en redes sociales, Llama3.1Nemotron Ultra253B ha demostrado un excelente rendimiento en varias pruebas de referencia clave. Este modelo cuenta con 253 mil millones de parámetros. En comparación con los 2 billones de parámetros totales de Llama4 Behemoth (288 mil millones de parámetros activos) y los 17 mil millones de parámetros activos de Maverick, Nemotron Ultra ha logrado un avance significativo en el equilibrio entre eficiencia y rendimiento.

Aunque los datos de referencia específicos aún no se han publicado completamente, se afirma que Nemotron Ultra supera a los modelos estrella de la serie Llama4 en capacidad de razonamiento, seguimiento de instrucciones y procesamiento de tareas generales. Esto se debe a la optimización de la arquitectura del modelo por parte de NVIDIA mediante la tecnología NAS, lo que reduce significativamente el consumo de memoria y la latencia de inferencia, manteniendo al mismo tiempo una alta precisión. En comparación, Llama4 Behemoth, a pesar de su gran cantidad de parámetros, requiere recursos computacionales más exigentes, mientras que Nemotron Ultra puede ejecutarse de manera eficiente en una sola unidad de 8x H100 GPU, mostrando su ventaja en términos de practicidad.

Lanzamiento de código abierto: Modelo amigable para empresas en Hugging Face

Llama3.1Nemotron Ultra253B no solo ofrece un rendimiento potente, sino que su estrategia de código abierto también ha sido muy elogiada. El modelo está disponible en la plataforma Hugging Face con pesos abiertos, bajo la licencia NVIDIA Open Model License y el acuerdo de licencia de la comunidad Llama3.1, permitiendo su uso comercial.

Se afirma que Nemotron Ultra253B no solo supera a Llama4 Behemoth y Maverick, sino que también está a la par de DeepSeek R1, y cuenta con licencia comercial, ¡lo que lo hace increíblemente popular! Esta iniciativa se considera un paso importante de NVIDIA para impulsar la democratización de la IA, ofreciendo a desarrolladores, empresas e investigadores un acceso sencillo a modelos de alto rendimiento.

Además, el modelo admite una longitud de contexto de hasta 128K, lo que lo hace adecuado para una variedad de tareas, como razonamiento avanzado, interacción de chat, generación mejorada por recuperación (RAG) y llamadas a herramientas. NVIDIA destaca que los desarrolladores pueden cambiar el "modo de razonamiento" (Reasoning On/Off) mediante indicaciones del sistema, adaptándose de manera flexible a las necesidades de diferentes escenarios de aplicación.

Cabe destacar que Llama4 Behemoth aún no se ha lanzado completamente (actualmente se encuentra en fase de entrenamiento), por lo que una comparación directa puede no ser completa. A pesar de ello, Nemotron Ultra, gracias a su naturaleza de código abierto y su eficiente adaptación a clústeres de GPU individuales, se considera un caballo negro en el campo de la IA actual.

QQ_1744161906170.png

La estrategia de NVIDIA

Analistas del sector opinan que el lanzamiento de Llama3.1Nemotron Ultra253B no solo representa un avance tecnológico, sino también una estrategia de NVIDIA dentro del ecosistema de IA. Al optimizar modelos de código abierto existentes y mejorar su rendimiento, NVIDIA no solo demuestra su capacidad en el desarrollo de software de IA, sino que también consolida la posición central de su hardware (especialmente las GPU H100) en la inferencia y el entrenamiento de IA. La ventaja de eficiencia de este modelo significa que las empresas pueden implementar soluciones de IA de alto rendimiento a un menor costo, lo que sin duda impulsará la demanda del hardware de NVIDIA.

La aparición de Llama3.1Nemotron Ultra253B marca otro avance significativo de NVIDIA en el campo de los modelos de lenguaje grandes. Su rendimiento superior a Llama4 Behemoth y Maverick, combinado con sus características de código abierto y su compatibilidad comercial, lo convierten en uno de los puntos más destacados del campo de la IA en 2025.

Enlace al proyecto: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b