Dans les dernières actualités technologiques, Zhipu a annoncé la dernière version de sa série GLM, le GLM-4.6. Le lancement de cette nouvelle version marque un nouveau progrès dans les technologies de puces nationales. Selon les informations officielles, le GLM-4.6 utilise une puce avancée nationale de Cambrionne, et a réussi à déployer avec succès une quantification mixte FP8 + Int4, ce qui est sans précédent pour les puces nationales. Il convient de noter que cette innovation a non seulement maintenu la précision du modèle, mais a également réduit de manière significative les coûts de raisonnement, ouvrant ainsi une nouvelle voie pour l'exécution locale des grands modèles sur les puces nationales.
Le lancement du GLM-4.6 signifie que la capacité d'auto-développement en intelligence artificielle en Chine s'est encore améliorée. La collaboration avec Cambrionne et Moivre Thread montre la forte performance du GLM-4.6 dans le cadre d'un framework de raisonnement vLLM. La nouvelle génération de GPU de Moivre Thread fonctionne également stablement avec une précision native FP8. Tout cela prouve la compatibilité écologique et la capacité de réponse rapide de l'architecture MUSA.
Zhipu prévoit également de rendre officiellement les services du GLM-4.6 disponibles aux utilisateurs grand publics et aux entreprises via sa plateforme MaaS. Cette nouvelle version n’est pas seulement une amélioration technique, mais inclut également des améliorations des capacités de reconnaissance et de recherche d’images, et prend en charge plusieurs outils de programmation populaires tels que Claude Code, Roo Code et Kilo Code. En outre, le forfait GLM Coding Max lancé par Zhipu offre plus d’espace d’utilisation aux développeurs fréquents, avec un prix mensuel minimum de 20 yuans.
Avec le développement continu des technologies, les utilisateurs inscrits au plan GLM Coding seront automatiquement mis à niveau vers le GLM-4.6. L’introduction des forfaits professionnels est spécialement conçue pour les entreprises nécessitant sécurité, efficacité économique et performances internationales de premier ordre. À l’avenir, les grands modèles GLM originaux chinois travailleront ensemble avec les puces nationales pour optimiser les performances et l’efficacité des processus d’entraînement et de raisonnement des modèles.
Le lancement du GLM-4.6 démontre non seulement les compétences techniques de Zhipu dans le domaine de l'intelligence artificielle, mais apporte également une nouvelle impulsion au développement des puces nationales. Avec la maturation des technologies, les grands modèles nationaux se feront jour dans de nombreux scénarios d'application.