NVIDIA lanza Llama 3.1 Nemotron Ultra 253B, superando el rendimiento de Llama 4 Behemoth

AIbase基地

Publicado elNoticias de IA · 8 minutos de lectura · Apr 9, 2025

El 8 de abril de 2025, NVIDIA anunció el lanzamiento de su último modelo de lenguaje grande (LLM): Llama3.1Nemotron Ultra253B. Este modelo, basado en Llama-3.1-405B-Instruct de Meta, se ha optimizado profundamente mediante la innovadora técnica de búsqueda de arquitectura neuronal (NAS). No solo supera en rendimiento a los modelos Behemoth y Maverick de la reciente serie Llama4, sino que también se ha lanzado como código abierto en la plataforma Hugging Face, generando un gran interés en la comunidad de IA.

Rendimiento excepcional: Superando a Llama4 Behemoth y Maverick

Según la información oficial de NVIDIA y los últimos debates en redes sociales, Llama3.1Nemotron Ultra253B ha demostrado un excelente rendimiento en varias pruebas de referencia clave. Este modelo cuenta con 253 mil millones de parámetros. En comparación con los 2 billones de parámetros totales de Llama4 Behemoth (288 mil millones de parámetros activos) y los 17 mil millones de parámetros activos de Maverick, Nemotron Ultra ha logrado un avance significativo en el equilibrio entre eficiencia y rendimiento.

Aunque los datos de referencia específicos aún no se han publicado completamente, se afirma que Nemotron Ultra supera a los modelos estrella de la serie Llama4 en capacidad de razonamiento, seguimiento de instrucciones y procesamiento de tareas generales. Esto se debe a la optimización de la arquitectura del modelo por parte de NVIDIA mediante la tecnología NAS, lo que reduce significativamente el consumo de memoria y la latencia de inferencia, manteniendo al mismo tiempo una alta precisión. En comparación, Llama4 Behemoth, a pesar de su gran cantidad de parámetros, requiere recursos computacionales más exigentes, mientras que Nemotron Ultra puede ejecutarse de manera eficiente en una sola unidad de 8x H100 GPU, mostrando su ventaja en términos de practicidad.

Lanzamiento de código abierto: Modelo amigable para empresas en Hugging Face

Llama3.1Nemotron Ultra253B no solo ofrece un rendimiento potente, sino que su estrategia de código abierto también ha sido muy elogiada. El modelo está disponible en la plataforma Hugging Face con pesos abiertos, bajo la licencia NVIDIA Open Model License y el acuerdo de licencia de la comunidad Llama3.1, permitiendo su uso comercial.

Se afirma que Nemotron Ultra253B no solo supera a Llama4 Behemoth y Maverick, sino que también está a la par de DeepSeek R1, y cuenta con licencia comercial, ¡lo que lo hace increíblemente popular! Esta iniciativa se considera un paso importante de NVIDIA para impulsar la democratización de la IA, ofreciendo a desarrolladores, empresas e investigadores un acceso sencillo a modelos de alto rendimiento.

Además, el modelo admite una longitud de contexto de hasta 128K, lo que lo hace adecuado para una variedad de tareas, como razonamiento avanzado, interacción de chat, generación mejorada por recuperación (RAG) y llamadas a herramientas. NVIDIA destaca que los desarrolladores pueden cambiar el "modo de razonamiento" (Reasoning On/Off) mediante indicaciones del sistema, adaptándose de manera flexible a las necesidades de diferentes escenarios de aplicación.

Cabe destacar que Llama4 Behemoth aún no se ha lanzado completamente (actualmente se encuentra en fase de entrenamiento), por lo que una comparación directa puede no ser completa. A pesar de ello, Nemotron Ultra, gracias a su naturaleza de código abierto y su eficiente adaptación a clústeres de GPU individuales, se considera un caballo negro en el campo de la IA actual.

La estrategia de NVIDIA

Analistas del sector opinan que el lanzamiento de Llama3.1Nemotron Ultra253B no solo representa un avance tecnológico, sino también una estrategia de NVIDIA dentro del ecosistema de IA. Al optimizar modelos de código abierto existentes y mejorar su rendimiento, NVIDIA no solo demuestra su capacidad en el desarrollo de software de IA, sino que también consolida la posición central de su hardware (especialmente las GPU H100) en la inferencia y el entrenamiento de IA. La ventaja de eficiencia de este modelo significa que las empresas pueden implementar soluciones de IA de alto rendimiento a un menor costo, lo que sin duda impulsará la demanda del hardware de NVIDIA.

La aparición de Llama3.1Nemotron Ultra253B marca otro avance significativo de NVIDIA en el campo de los modelos de lenguaje grandes. Su rendimiento superior a Llama4 Behemoth y Maverick, combinado con sus características de código abierto y su compatibilidad comercial, lo convierten en uno de los puntos más destacados del campo de la IA en 2025.

Enlace al proyecto: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

Qualcomm presenta dos chips de inferencia de IA en la nube, el AI200 y el AI250, que planea comercializar en 2026 y 2027, lo que marca su transición hacia una infraestructura integral de IA. Esta noticia impulso un aumento del 20% en el precio de las acciones en un solo día, el mayor aumento desde 2019. A diferencia de la estrategia completa de NVIDIA, Qualcomm se centra en el mercado de la inferencia de modelos grandes, destacando su ventaja en eficiencia energética y costo.

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

En la conferencia GTC de 2025, NVIDIA presentó el "Diseño Omniverse DSX", un esquema diseñado específicamente para centros de datos de IA de nivel giga, conocido como "fábrica de IA". Este esquema está basado en el marco Omniverse y admite diferentes escalas, desde 100 millones hasta 1.000 millones de vatios, con el objetivo de entrenar y ejecutar eficientemente modelos de IA grandes, satisfaciendo la creciente demanda de cálculo de IA, siendo un avance importante en la infraestructura de inteligencia artificial.

Huang Renxun refuta la teoría de la burbuja de la IA, la nueva generación de chips de NVIDIA se espera que genere 500 mil millones de dólares en ingresos

El CEO de NVIDIA, Huang Renxun, rechazó la teoría de la burbuja del mercado de la IA en la conferencia GTC de Washington, se espera que las nuevas generaciones de chips Blackwell y Rubin generen 500 mil millones de dólares en ingresos en los próximos trimestres, impulsando a la empresa a un período sin precedentes de crecimiento. Esta es la primera vez que NVIDIA organiza esta conferencia en la capital de EE.UU.

NVIDIA presenta el modelo de comprensión multimodal OmniVinci, con datos de entrenamiento únicamente 1/6

NVIDIA lanza el modelo de comprensión multimodal OmniVinci, obteniendo 19.05 puntos más que los modelos principales en varias pruebas estándar. Este modelo utiliza solo 0.2 billones de tokens de entrenamiento, teniendo una eficiencia de datos seis veces mayor que la de sus competidores. Su objetivo es lograr una comprensión unificada de la visión, el audio y el texto, impulsando el desarrollo de la capacidad cognitiva multimodal de las máquinas.

NVIDIA lanza el modelo de comprensión multimodal OmniVinci, rompe el SOTA con 19.05 puntos más

NVIDIA presenta el modelo de comprensión multimodal OmniVinci, que supera en 19.05 puntos a los modelos líderes en pruebas de referencia, logrando un rendimiento excelente con solo 1/6 de los datos de entrenamiento. Este modelo tiene como objetivo permitir que los sistemas de IA comprendan simultáneamente visión, audio y texto, simulando la percepción multisensorial humana.

NVIDIA venderá la supercomputadora personal AI DGX Spark a un precio de 3999 dólares

NVIDIA venderá la supercomputadora personal de inteligencia artificial DGX Spark el 15 de octubre a un precio de 3999 dólares. Este dispositivo es pequeño y puede colocarse en una mesa, tiene una gran capacidad de cálculo y es adecuado para entrenar modelos de IA y la investigación. Los usuarios pueden comprarlo a través del sitio web oficial y mediante socios en Estados Unidos, orientado a científicos de datos y investigadores en IA.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

NVIDIA lanza Llama 3.1 Nemotron Ultra 253B, superando el rendimiento de Llama 4 Behemoth

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

​NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

Huang Renxun refuta la teoría de la burbuja de la IA, la nueva generación de chips de NVIDIA se espera que genere 500 mil millones de dólares en ingresos

​NVIDIA presenta el modelo de comprensión multimodal OmniVinci, con datos de entrenamiento únicamente 1/6

NVIDIA lanza el modelo de comprensión multimodal OmniVinci, rompe el SOTA con 19.05 puntos más

​Qualcomm lanza una nueva generación de chips de IA, desafía el aumento del precio de NVIDIA en un 20%

Haciendo frente a las deficiencias en la inferencia del modelo: el equipo MIND de Apple acelera la contratación de talento en inteligencia artificial

¡Rompe el procesamiento de texto largo en LLM! DeepSeek-OCR presenta un mecanismo de compresión de memoria visual o resuelve el cuello de botella de la memoria de la IA

Oracle planea desplegar 50.000 chips de inteligencia artificial de AMD para ingresar al mercado de nube de inteligencia artificial

​NVIDIA venderá la supercomputadora personal AI DGX Spark a un precio de 3999 dólares

Noticias de IA relacionadas recomendadas

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

​NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

Huang Renxun refuta la teoría de la burbuja de la IA, la nueva generación de chips de NVIDIA se espera que genere 500 mil millones de dólares en ingresos

​NVIDIA presenta el modelo de comprensión multimodal OmniVinci, con datos de entrenamiento únicamente 1/6

NVIDIA lanza el modelo de comprensión multimodal OmniVinci, rompe el SOTA con 19.05 puntos más

​Qualcomm lanza una nueva generación de chips de IA, desafía el aumento del precio de NVIDIA en un 20%

Haciendo frente a las deficiencias en la inferencia del modelo: el equipo MIND de Apple acelera la contratación de talento en inteligencia artificial

¡Rompe el procesamiento de texto largo en LLM! DeepSeek-OCR presenta un mecanismo de compresión de memoria visual o resuelve el cuello de botella de la memoria de la IA

Oracle planea desplegar 50.000 chips de inteligencia artificial de AMD para ingresar al mercado de nube de inteligencia artificial

​NVIDIA venderá la supercomputadora personal AI DGX Spark a un precio de 3999 dólares

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

NVIDIA presenta el modelo de comprensión multimodal OmniVinci, con datos de entrenamiento únicamente 1/6

Qualcomm lanza una nueva generación de chips de IA, desafía el aumento del precio de NVIDIA en un 20%

NVIDIA venderá la supercomputadora personal AI DGX Spark a un precio de 3999 dólares

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

NVIDIA presenta el modelo de comprensión multimodal OmniVinci, con datos de entrenamiento únicamente 1/6

Qualcomm lanza una nueva generación de chips de IA, desafía el aumento del precio de NVIDIA en un 20%

NVIDIA venderá la supercomputadora personal AI DGX Spark a un precio de 3999 dólares