Hace unos días, la plataforma SiliconCloud lanzó oficialmente el modelo MoE de código abierto de Moonshot, Kimi K2. Este modelo tiene un total de 1T de parámetros y 32B de parámetros activos, y muestra un buen rendimiento en diversos benchmarks, pudiendo competir con modelos comerciales de élite. Kimi K2 destaca especialmente en tareas de programación y agentes generales, proporcionando a los desarrolladores una herramienta poderosa.

image.png

El modelo Kimi K2 admite una longitud máxima de contexto de hasta 128K, ofrece precios competitivos: el costo de entrada es de 4 yuanes por millón de Tokens y el costo de salida es de 16 yuanes por millón de Tokens. Además, SiliconCloud también lanzó otro modelo de programación grande llamado Kimi-Dev-72B, ampliando así su línea de productos.

image.png

Los usuarios pueden probar Kimi K2 a través de los sitios nacionales e internacionales de SiliconCloud. Los nuevos usuarios obtendrán automáticamente un crédito de prueba de 14 yuanes al registrarse, lo que les permite realizar su primera prueba en la plataforma. Los usuarios nacionales pueden usar este modelo a través del [enlace de experiencia en el sitio nacional](https://cloud.siliconflow.cn/models), mientras que los usuarios internacionales pueden acceder al [enlace de experiencia en el sitio internacional](https://cloud.siliconflow.com/models).

En cuanto a las características técnicas, Kimi K2 tiene tres principales ventajas: primero, un entrenamiento a gran escala, ya que fue entrenado en datos de 15.5T de Tokens, asegurando la estabilidad del modelo; segundo, Kimi K2 utiliza un optimizador MuonClip, que puede mantener la estabilidad durante la expansión a gran escala; finalmente, Kimi K2 es un modelo impulsado por agentes diseñado específicamente para llamadas a herramientas, razonamiento lógico y resolución autónoma de problemas.

Según los datos públicos de pruebas de benchmark, Kimi K2 destaca en capacidades como programación autónoma, llamadas a herramientas y razonamiento matemático. Moonshot indicó que Kimi K2 estableció una base sólida para construir capacidades de agentes generales, y en el futuro se agregarán capacidades como pensamiento y comprensión visual.

Las opiniones de los usuarios sobre Kimi K2 son generalmente positivas. Por ejemplo, Aravind Srinivas, fundador de Perplexity, elogió su excelente desempeño en evaluaciones internas y dijo que pronto realizará entrenamientos posteriores basados en este modelo. Además, algunos usuarios informaron que Kimi K2 mostró una capacidad sorprendente al completar una tarea de Minecraft en versión web de una sola vez, superando con creces a otros modelos.

Además de su destacada capacidad de programación, Kimi K2 también recibió elogios por sus habilidades lingüísticas, mostrando un vocabulario más diversificado. Los usuarios están satisfechos con el rendimiento general de Kimi K2 y esperan actualizaciones y expansiones futuras.

Destacado:  

🌟 El modelo Kimi K2 tiene 1T de parámetros y admite una longitud de contexto de 128K, mostrando un excelente desempeño.  

💰 Los nuevos usuarios pueden disfrutar de un crédito de prueba de 14 yuanes, facilitando la experiencia con las funciones del modelo.  

🛠️ Kimi K2 cuenta con un entrenamiento a gran escala, un optimizador estable y un diseño impulsado por agentes, adecuado para múltiples aplicaciones.