L'une des plateformes d'intelligence artificielle open source les plus renommées au monde, Hugging Face, a récemment publié un classement des contributeurs de modèles avec poids ouverts. Les équipes chinoises Qwen et DeepSeek ont réussi à figurer dans le top 15, démontrant ainsi la puissance technique et l'influence de la Chine dans le domaine mondial de l'IA open source. Ce classement honore les équipes qui fournissent des poids de modèles de haute qualité à la communauté open source, ces modèles étant largement utilisés pour l'innovation académique et industrielle.
L'équipe Qwen, soutenue par le groupe Cloud Intelligence d'Alibaba, a attiré l'attention de la communauté grâce aux performances exceptionnelles de ses modèles de série Qwen3 dans des tâches comme le suivi d'instructions et la génération de code. La série Qwen2.5-72B se classe parmi les modèles de langue grande taille open source les plus performants. Son modèle allégé, QwQ-32B, optimisé par apprentissage par renforcement, rivalise avec les grands modèles dans les raisonnements mathématiques et la génération de code, tout en réduisant sensiblement les coûts de déploiement.
DeepSeek, quant à elle, est connue pour sa série de modèles R1, qui offrent des performances exceptionnelles à faible coût. Le modèle R1-0528 a surpassé de nombreux concurrents internationaux sur le classement LiveCodeBench, se situant juste derrière les modèles de pointe d'OpenAI. Sa version allégée, DeepSeek-R1-0528-Qwen3-8B, optimisée par distillation des connaissances, peut être exécutée sur une seule carte graphique GPU et a surpassé Gemini2.5 Flash de Google lors du test de mathématiques AIME2025, montrant ainsi son avantage compétitif dans certains domaines spécifiques.
L’entrée de Qwen et DeepSeek dans ce classement reflète l’émergence des équipes chinoises dans l’écosystème open source. Un responsable de Hugging Face a souligné que leurs contributions fournissent des ressources efficaces aux développeurs mondiaux. Le PDG de NVIDIA, Jensen Huang, a également loué leur équilibre entre performance et coût, qui redessine actuellement le paysage de l'IA. À l'avenir, Qwen prévoit d'explorer les technologies multimodales, tandis que DeepSeek lancera le modèle R2, poursuivant ainsi l'innovation en IA.
Heatmap de publication de modèles Hugging Face : https://huggingface.co/spaces/cfahlgren1/model-release-heatmap