La empresa Moonshot ha lanzado oficialmente su nueva obra maestra: el modelo Kimi K2, y también ha anunciado simultáneamente que lo hará de código abierto. Este modelo base basado en una arquitectura MoE destaca por su potente capacidad para escribir código y su excelente habilidad para procesar tareas de Agent generales. Desde su lanzamiento, ha generado un gran interés en el campo de la inteligencia artificial.

El modelo Kimi K2 tiene un total de 1T de parámetros, y 32B de parámetros activos. En una serie de pruebas de rendimiento como SWE Bench Verified, Tau2 y AceBench, ha obtenido resultados destacados entre los modelos de código abierto, demostrando claramente su superioridad en la escritura de código, la ejecución de tareas de Agent y el razonamiento matemático.

En la etapa de entrenamiento previo, Kimi K2 utilizó un optimizador innovador llamado MuonClip, que resolvió eficazmente el problema de los logits de atención demasiado grandes durante el entrenamiento a gran escala, mejorando significativamente la estabilidad del entrenamiento y la eficiencia del uso de tokens. El equipo de Moonshot completó con éxito un entrenamiento estable de 15,5T de tokens, sin picos de pérdida, proporcionando una nueva perspectiva para el entrenamiento estable y eficiente de modelos con parámetros en la escala de billones.

Aparte de sus excelentes resultados en las pruebas de rendimiento, Kimi K2 también demuestra una gran capacidad de generalización y utilidad en aplicaciones prácticas. En términos de capacidad de programación, Kimi K2 no solo puede generar código frontend con diseño y expresión visual, apoyando formas complejas como sistemas de partículas, visualizaciones y escenas 3D, sino que también puede crear automáticamente interfaces completas para trading de futuros sin instrucciones específicas, mostrando así una fuerte capacidad de programación autónoma.

微信截图_20250712095131.png

En cuanto a la invocación de herramientas de Agent, Kimi K2 también muestra un buen desempeño. Puede analizar de manera estable instrucciones complejas y descomponer automáticamente las necesidades en una serie de estructuras de ToolCall con formato estándar y directamente ejecutables, integrándose sin problemas en diversos frameworks de Agent/Coding para completar tareas complejas o codificación automatizada. Ya sea analizar el impacto de la proporción de trabajo remoto en los salarios, o diseñar un plan para seguir a Coldplay y completar la planificación correspondiente, Kimi K2 puede manejarlo fácilmente, demostrando así una poderosa capacidad de Agent.

Además, Kimi K2 ha logrado mejoras notables en la escritura con estilo. Ya sea reescribir textos científicos en un tono de nivel primario, o imitar anuncios de Apple, Kimi K2 puede controlar con precisión el estilo de salida, manteniendo al mismo tiempo el significado original y el estilo de expresión. En tareas de escritura ficticia, los textos generados por Kimi K2 se centran más en detalles y emociones, en lugar de ser abstractos y genéricos, ofreciendo así una experiencia de creación más rica a los usuarios.

Esta vez, la empresa Moonshot no solo lanzó el modelo Kimi K2, sino que también puso a disposición de forma abierta dos versiones del modelo: Kimi-K2-Base y Kimi-K2-Instruct. Kimi-K2-Base es un modelo preentrenado base que no ha sido ajustado con instrucciones, ideal para escenarios de investigación y personalizados; mientras que Kimi-K2-Instruct es una versión ajustada con instrucciones generales, que muestra un excelente rendimiento en la mayoría de preguntas y respuestas así como en tareas de Agent. Los modelos y los archivos de pesos fp8 ya están disponibles en la plataforma HuggingFace, para que los desarrolladores los usen libremente.

Para facilitar la implementación y el uso por parte de los desarrolladores, motores de inferencia como vLLM, SGLang y ktransformers también han sincronizado el soporte para el modelo Kimi K2. Los desarrolladores pueden implementarlo en sus propios servidores y obtener una experiencia similar a la proporcionada por la API de la plataforma pública de Kimi.

En cuanto a los servicios de API, Kimi K2 también ofrece un completo soporte. Su servicio de API ya está completamente en línea, soportando un contexto máximo de 128K, con mayor versatilidad y capacidad de invocación de herramientas. Los planes de facturación son flexibles y razonables, con un costo de 4 yuanes por millón de tokens de entrada y 16 yuanes por millón de tokens de salida. Además, es compatible con dos formatos de API: OpenAI y Anthropic, facilitando así la transición sin interrupciones para los desarrolladores.