GPT-4 moins performant que ChatGPT pour le codage, taux d'erreur de 62 % ! RobustAPI, une nouvelle référence de fiabilité du code open source de deux chercheurs chinois de l'UC.

新智元

Publié leActualités IA · 2 minutes de lecture · Sep 5, 2023

Les grands modèles linguistiques (LLM) ont démontré des performances exceptionnelles dans la compréhension du langage naturel et la génération de code. Après plusieurs itérations, le code généré par les LLM présente désormais peu d'erreurs de syntaxe et correspond mieux au texte saisi par l'utilisateur, respectant la sémantique attendue. Cependant, la fiabilité et la robustesse de la génération de code par les LLM n'ont pas encore fait l'objet d'études approfondies. Deux chercheurs chinois de l'Université de Californie ont publié un nouveau jeu de données, RobustAPI, destiné à évaluer la fiabilité et la robustesse du code généré. Ce jeu de données comprend 1208 problèmes de codage collectés sur StackOverflow, portant sur l'évaluation de 24 API Java courantes. Les chercheurs ont résumé les schémas d'utilisation abusive courants de ces API et ont évalué les LLM couramment utilisés. Les résultats montrent que même GPT-4 génère du code contenant des erreurs d'utilisation d'API dans 62 % des cas, ce qui pourrait entraîner des conséquences imprévues si le code était déployé en production.

GPT-4 ChatGPT RobustAPI

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

L'étude d'Aalto révèle que l'IA peut amplifier l'effet Dunning-Kruger : les moins compétents surestiment leurs capacités cognitives après son utilisation.....

Oct 29, 2025

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

OpenAI passe du non lucratif au commercial, cherchant activement des investissements pour accélérer sa croissance. Cette réorganisation renforce sa compétitivité sur le marché et a eu un impact significatif sur son partenaire Microsoft, qui a vu sa valeur boursière dépasser 4 000 milliards de dollars. L'utilisation généralisée des technologies comme ChatGPT est un facteur clé de cette poussée.

Oct 29, 2025

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Adobe lance le modèle de génération d'images IA professionnel Firefly Image5, marquant une transformation qualitative du ''suffisant'' vers le niveau professionnel. Les nouvelles fonctions comprennent une sortie native de 4 millions de pixels, un éditeur de commandes par couches, des modèles personnalisés de style artistique et une génération de musique d'accompagnement audio IA, fermant ainsi le cercle de la création artistique en IA pour les images, les vidéos et les audios, redéfinissant ainsi le flux de travail créatif.

Oct 29, 2025

150

OpenAI et PayPal collaborent pour permettre des paiements et achats commerciaux directs dans ChatGPT

OpenAI et PayPal collaborent pour intégrer la fonction de paiement dans l'interface de ChatGPT, en s'appuyant sur le protocole ACP de Google. Les utilisateurs peuvent désormais effectuer des paiements directement via leur compte PayPal lors des conversations. C'est une nouvelle initiative d'OpenAI dans le commerce électronique. À partir de 2026, ChatGPT prendra en charge la recherche et l'achat de millions de produits proposés par des commerçants. PayPal a déjà pris en charge le protocole ACP pour permettre cette fonctionnalité.

Oct 29, 2025

PayPal et OpenAI font une collaboration, ChatGPT devient la première plateforme de paiement intégrée !

Le 28 octobre 2025, PayPal a conclu un partenariat avec OpenAI, intégrant ChatGPT au portefeuille de paiement. Les utilisateurs pourront effectuer des achats directement dans ChatGPT, améliorant ainsi la commodité des achats en ligne. Cette annonce a fait bondir les actions de PayPal avant la clôture de plus de 15 %, avec une réaction positive du marché. Le partenariat est prévu pour commencer l'année prochaine.

Oct 29, 2025

OpenAI annonce que les utilisateurs indiens peuvent bénéficier d'un service ChatGPT Go gratuit pendant un an

OpenAI a annoncé que, à partir du 4 novembre, les utilisateurs indiens pourront utiliser gratuitement le service ChatGPT Go pendant un an. Cette décision a été dévoilée lors de l'événement DevDay Exchange à Bangalore. ChatGPT Go a été lancé en août de cette année, offrant des fonctionnalités avancées plus étendues, notamment une limite supérieure de messages et plus d'opportunités d'utilisation quotidiennement. Le service gratuit est ouvert à tous les utilisateurs indiens qui s'enregistrent pendant la période de promotion.

Oct 28, 2025

Le bureau de droit fiscal Steuerrecht.com améliore son efficacité grâce à ChatGPT Business

Steuerrecht.com, cabinet fiscal de 10 experts, défie les grands concurrents en automatisant ses tâches via ChatGPT Business pour se concentrer sur le développement client et la croissance.....

Oct 28, 2025

140

Mise à niveau impressionnante de GPT-5 d'OpenAI pour les réponses sur la santé mentale, baisse de 65 % des réponses inappropriées

OpenAI lance GPT-5 avec une amélioration majeure des réponses en santé mentale. 0,15% des utilisateurs (≈1 million) expriment des intentions suicidaires hebdomadaires. Collaboration avec 300 experts de 60 pays pour optimiser les réponses.....

Oct 28, 2025

Le modèle DeepSeek remporte le concours de trading en bourse de Hong Kong et des États-Unis avec un rendement annuel de 10,61 %, bien supérieur à celui de GPT et au benchmark Nasdaq

Le modèle DeepSeek, développé en Chine, a surpassé les meilleurs modèles d'IA internationaux avec un rendement annualisé de 10,61% lors d'expériences de trading à l'Université de Hong Kong.....

Oct 28, 2025

170

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

L'IA devient un soutien psychologique informel mondial, avec des millions d'utilisateurs partageant leurs détresses, dont 0,15% évoquent des tendances suicidaires, soulevant des questions sur sa capacité à assumer cette confiance.....

Oct 28, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

GPT-4 moins performant que ChatGPT pour le codage, taux d'erreur de 62 % ! RobustAPI, une nouvelle référence de fiabilité du code open source de deux chercheurs chinois de l'UC.

新智元

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

OpenAI et PayPal collaborent pour permettre des paiements et achats commerciaux directs dans ChatGPT

PayPal et OpenAI font une collaboration, ChatGPT devient la première plateforme de paiement intégrée !

OpenAI annonce que les utilisateurs indiens peuvent bénéficier d'un service ChatGPT Go gratuit pendant un an

Le bureau de droit fiscal Steuerrecht.com améliore son efficacité grâce à ChatGPT Business

Mise à niveau impressionnante de GPT-5 d'OpenAI pour les réponses sur la santé mentale, baisse de 65 % des réponses inappropriées

Le modèle DeepSeek remporte le concours de trading en bourse de Hong Kong et des États-Unis avec un rendement annuel de 10,61 %, bien supérieur à celui de GPT et au benchmark Nasdaq

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

OpenAI et PayPal collaborent pour permettre des paiements et achats commerciaux directs dans ChatGPT

PayPal et OpenAI font une collaboration, ChatGPT devient la première plateforme de paiement intégrée !

OpenAI annonce que les utilisateurs indiens peuvent bénéficier d'un service ChatGPT Go gratuit pendant un an

Le bureau de droit fiscal Steuerrecht.com améliore son efficacité grâce à ChatGPT Business

Mise à niveau impressionnante de GPT-5 d'OpenAI pour les réponses sur la santé mentale, baisse de 65 % des réponses inappropriées

Le modèle DeepSeek remporte le concours de trading en bourse de Hong Kong et des États-Unis avec un rendement annuel de 10,61 %, bien supérieur à celui de GPT et au benchmark Nasdaq

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

GEO Services