En un momento clave en la competencia de modelos grandes, donde se pasa de "competir por el número de parámetros" a "competir por la eficiencia", MiniMax lanzó el 27 de octubre su nuevo modelo de razonamiento de código abierto M2, con una toma de decisiones ingenieril precisa, enfocándose en el campo central de las aplicaciones de inteligencia artificial del próximo nivel: los Agentes inteligentes.

M2 utiliza una arquitectura de expertos mixtos (Mixture-of-Experts, MoE), con un total de 230 mil millones de parámetros, pero activa solo 10 mil millones de parámetros por cada razonamiento, logrando una velocidad de salida de hasta 100 tokens por segundo. Este indicador de rendimiento le da una ventaja significativa en escenarios de interacción en tiempo real. Es especialmente importante que M2 esté diseñado específicamente para Agentes inteligentes, mejorando la coherencia y la eficiencia en la toma de decisiones, planificación de tareas múltiples y la interacción con el entorno, proporcionando así un motor fundamental para construir agentes de inteligencia artificial verdaderamente autónomos.

MiniMax, Xiyu Technology, IA, inteligencia artificial

Destaca que, en comparación con el modelo anterior M1, M2 ha realizado un ajuste estratégico en la ventana de contexto: se redujo drásticamente de los 1 millón de tokens soportados por el M1 a los 204.800 tokens. Esta cambio no es un retroceso tecnológico, sino un equilibrio práctico realizado por MiniMax entre el procesamiento de textos largos, la velocidad de razonamiento y los costos de implementación. Aunque el M1 estableció un récord al soportar "un millón de contexto", su alto consumo de recursos limitó su aplicación práctica; en cambio, el M2 se enfoca en tareas frecuentes y de alta respuesta para Agentes, manteniendo un suficiente largo de contexto mientras mejora significativamente la eficiencia de procesamiento y la economía.

Como modelo de código abierto, M2 reduce aún más la barrera para que los desarrolladores construyan agentes personalizados. Ya sea crear asistentes virtuales con cadenas de tareas complejas, robots de flujo de trabajo automatizado o agentes de decisión integrados en sistemas empresariales, los desarrolladores pueden iterar rápidamente basándose en M2 y ajustar flexiblemente.

MiniMax posiciona claramente a M2 como "la base de razonamiento en la era de los Agentes". En la ola en la que la IA está pasando de ser "una herramienta de preguntas y respuestas" a "un agente de acción", el lanzamiento de M2 no es solo una actualización del modelo, sino una apuesta por el paradigma siguiente de las aplicaciones de inteligencia artificial: cuando los agentes necesitan pensar rápidamente, actuar continuamente y interactuar eficientemente, la velocidad y el costo podrían ser más importantes que la longitud del contexto.