OpenAI a annoncé le lancement de deux modèles linguistiques à poids ouverts — gpt-oss-120b et gpt-oss-20b, marquant ainsi le retour d'OpenAI dans le domaine du logiciel libre depuis la sortie de GPT-2 en 2019. Cette initiative représente un tournant majeur dans la stratégie d'OpenAI, tout en offrant aux développeurs du monde entier des outils puissants pour le raisonnement, accélérant ainsi la diffusion et l'innovation en matière de technologies de l'intelligence artificielle.
Modèles à poids ouverts, offrant plus de liberté aux développeurs
Conformément à l'annonce officielle d'OpenAI, les modèles gpt-oss-120b et gpt-oss-20b sont publiés sous la licence Apache 2.0, permettant aux développeurs de télécharger, modifier et utiliser ces modèles à des fins commerciales. Ces deux modèles adoptent une architecture de Experts Mélange (MoE), avec respectivement 117 milliards et 21 milliards de paramètres, activant chacun 5,1 milliards et 3,6 milliards de paramètres, alliant efficacité du raisonnement et faible consommation de ressources.
- gpt-oss-120b: peut fonctionner sur une seule carte graphique NVIDIA H100 (80 Go de mémoire), idéal pour les centres de données ou les scénarios d'entreprise avancés. Sa performance est proche de celle des modèles propriétaires d'OpenAI, o4-mini, notamment dans les compétitions de programmation (Codeforces), la résolution générale de problèmes (MMLU, HLE) et les requêtes liées à la santé (HealthBench).
- gpt-oss-20b: nécessite seulement 16 Go de mémoire pour fonctionner sur des appareils de bord, idéal pour le raisonnement local et les applications côté appareil. Sa performance est comparable à celle de o3-mini, notamment dans les domaines de mathématiques de compétition (AIME2024 & 2025).
Ces modèles supportent une longueur de contexte allant jusqu'à 128k tokens, utilisent une mécanique d'attention alternée dense et bande étroite, et emploient une technique d'attention multi-requête par groupe pour améliorer l'efficacité du raisonnement. OpenAI a également rendu public le décodeur 'o200k_harmony', réduisant davantage les barrières à l'entrée pour les développeurs.
Sécurité et responsabilité, redéfinissant les normes du logiciel libre
OpenAI souligne dans son annonce que la sécurité constitue un principe fondamental des modèles gpt-oss. Face au risque de micro-optimisation malveillante des modèles open source, OpenAI a testé le gpt-oss-120b via des tests de micro-optimisation contre-attaquants, et a vérifié son fonctionnement grâce à son "cadre de préparation" (Preparedness Framework), confirmant qu’après une optimisation malveillante, le modèle n’atteint pas un niveau élevé de capacité dans les domaines de la biologie, de la chimie et de la cybersécurité. L’examen par des experts externes a encore renforcé les normes de sécurité du modèle.
En outre, OpenAI invite les développeurs à appliquer des mesures de sécurité supplémentaires en fonction de leurs besoins, afin de faire face aux risques potentiels dans divers scénarios d'utilisation. Les résultats des tests de sécurité sont détaillés dans les cartes de modèle et les articles de recherche, fournissant une référence transparente à la communauté open source.
Changement stratégique, répondre à la concurrence open source et aux besoins des entreprises
Cette initiative d'OpenAI est perçue comme une adaptation stratégique face à la concurrence dans le domaine open source. Ces dernières années, Meta, DeepSeek et d'autres entreprises ont ouvert leurs modèles pour capturer le marché, forçant ainsi OpenAI à reconsidérer sa stratégie de fermeture. Sam Altman, PDG d'OpenAI, a déclaré lors d'une séance de questions-réponses sur Reddit que l'approche open source de l'entreprise avait « pris la mauvaise direction », et que cette publication constituait le premier pas vers l'engagement de retour au logiciel libre.
Aussi, la série gpt-oss répond aux besoins des entreprises en matière de déploiement localisé et de confidentialité des données. Des secteurs réglementés tels que la finance, la médecine et le droit peuvent déployer les modèles sur des serveurs privés, évitant ainsi les risques de fuite de données. OpenAI collabore également avec des institutions telles que le centre national suédois d'intelligence artificielle AI Sweden pour explorer l'adaptation locale et améliorer les performances des modèles dans des contextes linguistiques et culturels spécifiques.
Empowerment de l'écosystème des développeurs, ouvrant de nouvelles possibilités pour l'IA
La série gpt-oss prend en charge plusieurs cadres de développement tels que Transformers, vLLM, Ollama et llama.cpp. Les développeurs peuvent télécharger les poids des modèles via des plateformes comme Hugging Face et GitHub, et se lancer rapidement grâce aux codes de référence fournis par OpenAI. Le modèle intègre le raisonnement en chaîne (Chain-of-Thought), l'appel d'outils (supportant l'exécution de code Python, la recherche sur le web, etc.) et la sortie structurée (JSON, YAML, etc.), particulièrement adapté à la création de workflows d'agents intelligents.
De plus, le modèle prend en charge trois niveaux de raisonnement (faible, moyen, élevé), permettant aux développeurs d'équilibrer vitesse et précision selon les exigences des tâches.
Le lancement de gpt-oss n'offre pas seulement aux développeurs des outils d'IA performants et abordables, mais il influence profondément la structure de l'industrie de l'IA. Comparé aux modèles Llama de Meta ou R1 de DeepSeek, gpt-oss présente un avantage net en termes de capacité de raisonnement et d'utilisation d'outils, bien que sa limitation à un seul mode texte signifie qu'il faut recourir à des appels API pour compléter les fonctions multimodales.
OpenAI indique que l'avenir sera marqué par une amélioration continue de la série gpt-oss en fonction des retours de la communauté, sans promettre de plan de mise à jour précis. Selon les experts du secteur, cette initiative pourrait encourager davantage d'entreprises à adopter une stratégie hybride d'IA, combinant modèles open source et services cloud, pour équilibrer coûts et flexibilité.
Billet de blog officiel : https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/