Llama-4-Maverick de Meta cae en picado en el ranking, generando sospechas de manipulación

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Apr 14, 2025

Recientemente, el modelo de lenguaje grande de código abierto Llama-4-Maverick, lanzado por Meta, cayó del segundo al puesto 32 en la clasificación de LMArena. Esta drástica fluctuación ha generado amplias dudas entre los desarrolladores, quienes sospechan que Meta podría haber manipulado la clasificación presentando una versión especial.

El problema comenzó el 6 de abril, cuando Meta lanzó su último modelo de lenguaje grande, Llama4, que incluye tres versiones: Scout, Maverick y Behemoth. Inicialmente, Llama-4-Maverick mostró un rendimiento excepcional, ocupando el segundo lugar en la clasificación de LMArena, solo superado por Gemini2.5Pro.

Sin embargo, a medida que se fueron conociendo las opiniones de los desarrolladores sobre la versión de código abierto de Llama4, la reputación del modelo se desplomó rápidamente. Algunos desarrolladores descubrieron diferencias significativas entre la versión presentada por Meta a LMArena y la versión de código abierto que se publicó, lo que llevó a sospechar de una posible manipulación de la clasificación.

Modelo matemático LLM Alpaca

Nota de la imagen: Imagen generada por IA, provista por Midjourney.

Según Chatbot Arena, la versión inicial presentada por Meta, Llama-4-Maverick-03-26-Experimental, era una versión experimental optimizada que logró el segundo puesto. La versión de código abierto corregida, Llama-4-Maverick-17B-128E-Instruct, con 17 mil millones de parámetros activos y 128 expertos MoE, solo ocupa el puesto 32, muy por detrás de modelos mejor clasificados como Gemini2.5Pro y GPT4o, incluso inferior al Llama-3.3-Nemotron-Super-49B-v1, basado en una generación anterior del modelo.

En una reciente presentación, Meta explicó el rendimiento inferior a lo esperado de Llama-4-Maverick-03-26-Experimental diciendo que el modelo estaba "especialmente optimizado para conversaciones", lo que explica su buen desempeño en LM Arena. Esta optimización, aunque le dio una alta puntuación en la clasificación, dificulta a los desarrolladores predecir con precisión el rendimiento real del modelo en diferentes contextos.

Un portavoz de Meta declaró a TechCrunch que la compañía seguirá explorando diferentes versiones personalizadas y espera que los desarrolladores ajusten y mejoren Llama4 según sus necesidades. Meta busca fomentar la creatividad de los desarrolladores y valora sus comentarios.

Llama-4-Maverick Meta LMArena Modelo grande

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Meta contrata a OpenAI con 3.2 mil millones de dólares ¡La guerra por los talentos en IA explota! ¿El escenario del sector va a cambiar?

Jun 30, 2025

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China

Recientemente, Baidu anunció oficialmente la apertura de su serie de modelos WENXIN Grand Model 4.5, lanzando un total de diez modelos, incluyendo modelos de expertos mixtos (MoE) con parámetros de activación de 47B y 3B, así como modelos densos con parámetros de 0.3B. Esta apertura no solo incluye la publicación completa de los pesos de preentrenamiento, sino que también proporciona código de razonamiento, marcando un importante avance en el campo de los modelos grandes de Baidu. Estos nuevos modelos pueden descargarse y implementarse en plataformas como el foro PaddlePaddle Star River y Hugging Face, y además, la plataforma de modelos grandes Qianfan de Baidu Cloud también ofrece

Jun 30, 2025

Baidu presenta de forma destacada la serie de modelos WENXIN Grand Model 4.5, diez nuevos modelos se presentan!

Baidu ha lanzado oficialmente la serie de modelos WENXIN Grand Model 4.5 y los ha hecho completamente de código abierto. Los usuarios pueden experimentar inmediatamente esta tecnología más reciente mediante WENXIN YAN (https://yiyan.baidu.com). Esta serie de modelos incluye varias configuraciones de parámetros, como modelos de expertos mixtos (MoE) con parámetros activos de 47B y 3B, así como diseños de modelos densos con 0.3B parámetros, en total alcanzando diez modelos diferentes. En cuanto al entrenamiento y la inferencia, los modelos de la serie WENXIN 4.5 utilizan PaddlePaddle.

Jun 30, 2025

Regreso gratuito de la API Gemini2.5Pro, comunidad de desarrolladores responde con entusiasmo

Recientemente, Google anunció que la API de su modelo de IA principal Gemini2.5Pro volverá a estar incluida en el nivel gratuito de Google AI Studio, lo que ha generado un amplio interés y discusión en la comunidad de desarrolladores. Según informes de AIbase, este movimiento marca un importante avance en la democratización de la tecnología de IA por parte de Google, brindando a los desarrolladores nuevas oportunidades para innovar con menor barrera de entrada. Gemini2.5Pro es el modelo de IA más avanzado hasta ahora de Google, destacando por sus excepcionales capacidades multimodales y una poderosa capacidad de razonamiento.

Jun 30, 2025

Optimización de memoria VR! NVIDIA DLSS 4 hace que los juegos sean más fluidos, la memoria VR del modelo Transformer se reduce en un 20%

Jun 30, 2025

Lanzamiento impactante de AliOvis-U1: IA multimodal trifuncional, apertura de código para desarrolladores de todo el mundo

El 29 de junio de 2025, el equipo de IA internacional de Alibaba presentó oficialmente el nuevo modelo de gran tamaño multimodal **Ovis-U1**, lo que marca un nuevo gran avance en el campo de la inteligencia artificial multimodal. Como la última obra maestra de la serie Ovis, el Ovis-U1 integra funciones de comprensión multimodal, generación de imágenes y edición de imágenes, demostrando una poderosa capacidad de procesamiento multiformato, brindando nuevas posibilidades a desarrolladores, investigadores y aplicaciones industriales. A continuación, encontrará el reportaje detallado de AIbase sobre Ovis-U1. Ovis-U1

Jun 30, 2025

Tencent abre el código de Hunyuan-A13B: un modelo de inteligencia artificial con pequeño tamaño y gran sabiduría

Jun 30, 2025

¡Gran lanzamiento! El primer modelo de gran escala abierto marino de China, OceanGPT (Cangyuan), hace su aparición!

Jun 30, 2025

Modelo de 7B de Pangu de Huawei y modelo de expertos mixtos de 72B

El 30 de junio, Huawei anunció oficialmente el modelo denso de 7.000 millones de parámetros Pangu, el modelo de expertos mixtos PanguPro MoE de 72.000 millones de parámetros, y la tecnología de inferencia de modelos basada en Ascend. Esta medida de apertura es un paso clave en la estrategia ecológica de Ascend de Huawei, con el objetivo de impulsar la investigación y el desarrollo innovador de las tecnologías de modelos grandes, acelerar la aplicación de la inteligencia artificial en diversos sectores y crear valor.

Jun 30, 2025

¡Lanzamiento importante! El primer modelo masivo de generación a nivel mundial con mil billones de parámetros, Qinyuan, llega con una gran impresión!

El 30 de junio, el modelo masivo de generación a nivel mundial con mil billones de parámetros "Qinyuan", desarrollado por el Grupo Nacional de Energía, fue oficialmente lanzado. Este modelo innovador destaca por sus características de total autonomía y control, marcando un paso importante hacia una nueva era de toma de decisiones inteligentes en la industria de generación de energía. El modelo "Qinyuan" tiene como objetivo integrar diversos escenarios de la industria de generación de energía, su alta complejidad y especialización, aprovechando plenamente la mayor capacidad de instalación del Grupo Nacional de Energía a nivel mundial y su gran cantidad de recursos de datos. La introducción de este modelo no solo abre nuevas fuerzas impulsoras para la optimización dinámica multisistema, sino que también establece un sistema eléctrico

Jun 30, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Llama-4-Maverick de Meta cae en picado en el ranking, generando sospechas de manipulación

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Meta contrata a OpenAI con 3.2 mil millones de dólares ¡La guerra por los talentos en IA explota! ¿El escenario del sector va a cambiar?

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China

Baidu presenta de forma destacada la serie de modelos WENXIN Grand Model 4.5, diez nuevos modelos se presentan!

Regreso gratuito de la API Gemini2.5Pro, comunidad de desarrolladores responde con entusiasmo

Optimización de memoria VR! NVIDIA DLSS 4 hace que los juegos sean más fluidos, la memoria VR del modelo Transformer se reduce en un 20%

Lanzamiento impactante de AliOvis-U1: IA multimodal trifuncional, apertura de código para desarrolladores de todo el mundo

Tencent abre el código de Hunyuan-A13B: un modelo de inteligencia artificial con pequeño tamaño y gran sabiduría

¡Gran lanzamiento! El primer modelo de gran escala abierto marino de China, OceanGPT (Cangyuan), hace su aparición!

Modelo de 7B de Pangu de Huawei y modelo de expertos mixtos de 72B

¡Lanzamiento importante! El primer modelo masivo de generación a nivel mundial con mil billones de parámetros, Qinyuan, llega con una gran impresión!