Aujourd'hui, lors d'une diffusion en direct sur Internet, OpenAI a épaté le monde avec l'annonce d'un nouvel agent d'intelligence artificielle pour le codage dans le cloud — Codex, marquant ainsi l'ouverture d'une nouvelle ère dans la programmation assistée par l'IA. Le groupe de six personnes mené par Greg Brockman a présenté à travers le monde cet outil puissant capable de réaliser des tâches qui pourraient autrefois prendre plusieurs jours en seulement une demi-heure, considérablement améliorant ainsi l'efficacité du développement.
Codex repose sur un nouveau modèle appelé codex-1, une version spécialement ajustée du modèle o3 d'OpenAI, conçue spécifiquement pour les besoins de l'ingénierie logicielle. Outre sa capacité à exécuter en parallèle plusieurs tâches de manière sécurisée dans un environnement sandbox cloud, il peut également intégrer GitHub sans effort et appeler directement les dépôts de code. Codex peut rapidement construire des modules fonctionnels, répondre en profondeur aux questions sur les dépôts de code, corriger précisément les vulnérabilités dans le code, soumettre des PR et effectuer automatiquement des tests de validation. Ces tâches qui pouvaient auparavant nécessiter des heures voire des jours pour les développeurs peuvent maintenant être réalisées efficacement par Codex en 30 minutes au maximum.
Le fonctionnement de Codex repose sur l'infrastructure informatique d'OpenAI, partageant le même système que celui utilisé pour l'apprentissage par renforcement. Chaque tâche s'exécute dans un environnement sandbox virtuel indépendant, doté de systèmes de fichiers, de processeurs CPU, de mémoire et de stratégies réseau exclusifs, garantissant ainsi une performance optimale et une sécurité maximale. Codex s'est également distingué dans le référentiel preparedness et a géré avec aisance la bibliothèque CodeX CLI, démontrant ainsi sa capacité de généralisation à différents projets.
Pour garantir que les sorties de Codex correspondent de manière高度 conforme aux préférences et standards de codage humains, OpenAI a particulièrement axé la formation du modèle codex-1 sur des tâches réelles et des environnements diversifiés. Les tests de référence montrent que codex-1 a obtenu un score de 72,1 % sur SWE-bench, surpassant Claude3.7 et o3-high. OpenAI a également fourni des exemples pratiques de comparaison entre Codex et o3 sur quatre dépôts open-source (astropy, matplotlib, django et expensify), montrant que le code généré par Codex est plus simple et performant.
Actuellement, Codex est officiellement disponible pour les utilisateurs ChatGPT Pro, Entreprise et Team à l'échelle mondiale. Les utilisateurs Plus et Edu pourront bientôt y accéder également.
En parallèle, OpenAI a également publié une version miniaturisée du modèle codex-1 optimisée pour le CLI de Codex — le modèle o4-mini, simplifiant ainsi la méthode de connexion. Maintenant, les développeurs peuvent se connecter directement via leur compte ChatGPT. Pour encourager son utilisation, les utilisateurs connectés via ChatGPT au CLI de Codex pendant les 30 prochains jours recevront un crédit gratuit.
Même si Codex est actuellement en phase de prévisualisation de recherche et ne supporte pas encore des capacités frontales telles que l'entrée d'images ou la correction en temps réel pendant l'exécution des tâches, OpenAI prévoit de continuer à améliorer son interactivité et sa flexibilité dans le futur. Parmi les futures fonctionnalités figurent la possibilité de fournir des instructions en cours de tâche, de collaborer avec une IA pour mettre en œuvre des stratégies, de recevoir des mises à jour progressives et d'intégrer profondément des outils courants. L’apparition de Codex pourrait redéfinir les fondements de la conception logicielle, allumant ainsi le foyer d’une véritable révolution dans le domaine du codage.