Hace poco, Meituan anunció el lanzamiento de un gran modelo de razonamiento basado en la arquitectura de expertos mixtos - LongCat-Flash-Thinking. Este nuevo modelo tiene una cantidad de parámetros que alcanza los 56 mil millones, lo cual es notable. Pero lo más sorprendente es que puede activar dinámicamente entre 18.600 millones y 31.300 millones de parámetros según las necesidades del contexto, activando un promedio de unos 27.000 millones de parámetros. Este diseño flexible hace que el modelo se desempeñe muy bien en múltiples tareas, especialmente en razonamiento lógico, cálculos matemáticos y programación.

image.png

Según los datos oficiales de Meituan, LongCat-Flash-Thinking realizó una comparación profunda con otros modelos principales en una serie de pruebas estándar. En cuanto al razonamiento matemático, por ejemplo, en las pruebas MATH500 y AIME25, el modelo mostró un buen rendimiento, e incluso afirmó que usando herramientas nativas se puede reducir el consumo de tokens en un 64,5%, logrando aún así una precisión de nivel máximo. Además, en áreas como el razonamiento general (GPQA-Diamond), generación de código (LiveCodeBench, OJBench) y demostración de teoremas formalizados (MiniF2F-Test), su rendimiento también se acerca al nivel líder de la industria.

image.png

Los pesos del modelo LongCat-Flash-Thinking están disponibles bajo la licencia MIT, por lo que los desarrolladores ahora pueden usar y estudiar libremente esta poderosa herramienta. El equipo oficial también proporcionó plantillas detalladas para chats y ya tiene un sitio web exclusivo para chats, facilitando la interacción y práctica de los usuarios.

LongCat-Flash-Thinking no es solo un modelo de inteligencia artificial a gran escala, sino también una importante prueba en el campo de investigación de inteligencia artificial de Meituan. Su excelente rendimiento y arquitectura flexible ofrecerán nuevas posibilidades para el desarrollo de aplicaciones y la investigación posterior.

Dirección del sitio web: https://longcat.chat/