Le 30 juin, Baidu a officiellement rendu open source sa dernière série de modèles WENXIN Da Model 4.5, comprenant un total de 10 modèles, notamment des modèles à expert en mélange (MoE) avec 47 milliards et 3 milliards de paramètres d'activation, ainsi qu'un modèle dense avec 0,3 milliard de paramètres. Cette ouverture au code source permet non seulement aux développeurs d'utiliser gratuitement ces puissants modèles, mais fournit également des poids de pré-entraînement et du code de raisonnement, facilitant ainsi diverses applications.

Au cours de cette publication, Intel a également démontré son solide soutien technique. Grâce au kit d'outils OpenVINO, Intel a adapté ces modèles côté terminal le jour même de la publication du modèle WENXIN Da, et les a déployés efficacement sur sa plateforme Core Ultra. OpenVINO est un outil open source développé par Intel, visant à optimiser et accélérer les performances de raisonnement des modèles d'apprentissage automatique, à permettre le déploiement sur plusieurs plateformes, et à tirer pleinement parti des ressources matérielles d'Intel.

Baidu, WENXIN YAN, WENXIN Da Model

Il convient de noter que depuis 2021, l'équipe Paddle de Baidu a travaillé en étroite collaboration avec l'équipe OpenVINO d'Intel. Les deux parties ont réalisé des adaptations pour plusieurs modèles, tels que PaddleOCR, PaddleSeg et PaddleDetection. Cette coopération permet aux développeurs d'utiliser directement les modèles Paddle et de les faire fonctionner via OpenVINO, voire de convertir les modèles en format IR à l'aide du optimizeur de modèles d'OpenVINO, améliorant ainsi les performances de déploiement.

La publication de la série WENXIN Da Model 4.5 marque une nouvelle avancée majeure de Baidu dans les domaines de la compréhension multimodale, de la génération de texte et de la réflexion logique. Les performances de cette série de modèles dépassent même celles de GPT4.5 dans plusieurs tests, et le coût d'appel de l'API n'est que de 1 % de celui de GPT4.5. Cela représente clairement un choix attrayant pour les développeurs souhaitant intégrer la technologie de l'intelligence artificielle à leurs produits et services.