La société Moonshot a officiellement lancé sa toute nouvelle création, le modèle Kimi K2, et a simultanément annoncé son ouverture au code source. Ce modèle de base basé sur une architecture MoE, grâce à ses puissantes capacités en codage et à sa remarquable capacité à traiter des tâches d'Agent générales, a suscité un grand intérêt dans le domaine de l'intelligence artificielle dès sa sortie.

Le modèle Kimi K2 possède un total de 1T de paramètres, avec 32B de paramètres activés. Il a obtenu des résultats exceptionnels dans plusieurs tests de référence tels que SWE Bench Verified, Tau2 et AceBench, ce qui démontre pleinement ses compétences avancées en matière de rédaction de code, d'exécution de tâches d'Agent et de raisonnement mathématique.

Durant la phase de pré-entraînement, le modèle Kimi K2 a utilisé un optimiseur innovant appelé MuonClip, qui a efficacement résolu le problème des logits d'attention trop élevés lors de l'entraînement à grande échelle, améliorant ainsi la stabilité de l'entraînement et l'efficacité de l'utilisation des tokens. L'équipe de Moonshot a réussi à entraîner de manière stable 15,5 T de tokens, sans pic de perte, offrant ainsi une nouvelle approche pour un entraînement stable et efficace des modèles à milliards de paramètres.

Au-delà de ses performances excellentes dans les tests de référence, le modèle Kimi K2 a également démontré une forte capacité de généralisation et une utilité pratique dans des scénarios d'application réels. En termes de compétences en codage, Kimi K2 peut non seulement générer du code front-end qui allie design et expression visuelle, soutenant des systèmes de particules, de visualisation et de scènes 3D complexes, mais peut aussi construire automatiquement une interface complète pour le trading de futures sans instructions spécifiques, illustrant ainsi sa forte capacité de programmation autonome.

微信截图_20250712095131.png

En ce qui concerne l'appel d'outils d'Agent, Kimi K2 s'est également distingué. Il peut interpréter efficacement des instructions complexes, décomposer automatiquement les besoins en structures de ToolCall standardisées et directement exécutables, s'intégrer facilement à divers cadres d'Agent/Coding, et accomplir des tâches complexes ou de l'automatisation du codage. Que ce soit pour analyser l'impact de la proportion du télétravail sur les salaires, ou pour élaborer un plan de suivi des fans de Coldplay et effectuer les plans correspondants, Kimi K2 y parvient facilement, montrant ainsi une forte capacité en Agent.

De plus, le modèle Kimi K2 a connu des progrès significatifs en matière d'écriture stylisée. Qu'il s'agisse de reformuler des textes scientifiques dans un ton adapté aux collégiens, ou d'imiter le style des publicités Apple, Kimi K2 peut contrôler précisément le style de sortie tout en conservant le sens original et le style d'expression. Dans les tâches d'écriture fictive, les textes générés par Kimi K2 portent davantage sur les détails et les émotions, plutôt que sur des propos abstraits et vagues, offrant ainsi une expérience créative plus riche aux utilisateurs.

En plus du lancement du modèle Kimi K2, la société Moonshot a également rendu disponibles deux versions du modèle, Kimi-K2-Base et Kimi-K2-Instruct. Kimi-K2-Base est un modèle pré-entraîné de base non ajusté aux instructions, idéal pour la recherche et les scénarios personnalisés ; tandis que Kimi-K2-Instruct est une version ajustée aux instructions générales, performante dans la plupart des questions et tâches d'Agent. Les modèles et les fichiers de poids fp8 sont désormais disponibles sur la plateforme HuggingFace, pour l'utilisation libre des développeurs.

Pour faciliter le déploiement et l'utilisation par les développeurs, des moteurs d'inférence tels que vLLM, SGLang et ktransformers prennent également en charge le modèle Kimi K2. Les développeurs peuvent déployer le modèle sur leurs propres serveurs pour obtenir une expérience similaire à celle fournie par l'API de la plateforme Kimi.

En matière de service API, le modèle Kimi K2 propose également un support complet. Son service API est désormais pleinement opérationnel, supporte un contexte maximal de 128K, offre une meilleure généralité et une meilleure capacité d'appel d'outils. Les forfaits de tarification sont flexibles et raisonnables : 4 yuans par million de tokens d'entrée et 16 yuans par million de tokens de sortie. De plus, il est compatible avec les deux formats d'API OpenAI et Anthropic, facilitant ainsi le passage sans heurt pour les développeurs.