Les capacités de diagnostic médical de ChatGPT remises en question : une étude révèle un taux d'erreur pouvant atteindre 50 %

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Aug 19, 2024

333

Malgré les progrès remarquables de l'intelligence artificielle (IA) dans le domaine médical, une nouvelle étude révèle des lacunes importantes des IA généralistes comme ChatGPT dans le diagnostic médical complexe.

Une équipe de chercheurs dirigée par Amrit Kirpalani, spécialiste de l'enseignement médical à l'Université Western de l'Ontario au Canada, a constaté que ChatGPT a commis des erreurs dans 76 cas sur 150 cas médicaux complexes provenant de la base de données Medscape, soit un taux d'erreur supérieur à 50 %.

L'étude a utilisé la banque de questions de Medscape, dont les cas sont plus proches de la réalité médicale que l'examen d'autorisation médicale américaine (USMLE), incluant des complications multiples et des défis diagnostiques. L'équipe de recherche a contourné l'interdiction d'OpenAI concernant l'utilisation de ChatGPT pour des conseils médicaux grâce à une conception ingénieuse des invites.

IA médicale (2)

Source de l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Kirpalani souligne que les mauvaises performances de ChatGPT sont dues à deux facteurs : premièrement, ChatGPT manque de connaissances approfondies en médecine par rapport aux IA médicales spécialisées ; deuxièmement, ChatGPT est moins performant dans les « zones grises » de la médecine, incapable d'interpréter des résultats d'examen légèrement anormaux avec la même flexibilité qu'un médecin humain.

Plus inquiétant encore, même lorsqu'il fournit un diagnostic erroné, ChatGPT peut offrir des explications apparemment raisonnables et convaincantes. Cette caractéristique pourrait induire en erreur les non-professionnels et augmenter le risque de propagation de fausses informations.

Néanmoins, l'IA conserve une certaine valeur dans le domaine médical. Edward Tran, coauteur de l'étude, indique que ChatGPT est devenu un outil important dans l'enseignement médical, aidant les étudiants à organiser leurs notes, à clarifier les algorithmes de diagnostic et à se préparer aux examens. Cependant, Kirpalani recommande fortement au public de ne pas utiliser ChatGPT pour obtenir des conseils médicaux et de continuer à consulter des professionnels de santé.

Kirpalani estime que la création de médecins IA fiables nécessite un entraînement intensif sur des données cliniques et une surveillance rigoureuse. À court terme, l'IA est plus susceptible d'améliorer le travail des médecins humains que de les remplacer entièrement. Avec les progrès technologiques constants, l'application de l'IA dans le domaine médical reste un sujet d'attention.

IA généraliste ChatGPT Diagnostic médical Medscape

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Lancement de « Guanxin », le premier grand modèle d'IA cardiovasculaire en Chine, visant à améliorer l'intelligence de diagnostic médical

Récemment, l'hôpital Zhongshan affilié à l'Université Fudan et l'Institut de l'intelligence scientifique de Shanghai ont conjointement lancé « Guanxin » (CardioMind), le premier grand modèle d'IA spécialisé en cardiologie en Chine. Cette innovation technologique marque l'arrivée officielle d'une nouvelle ère d'intelligence dans le diagnostic et le traitement des maladies cardiovasculaires. Désigné comme « cardiologue IA », ce modèle vise à imiter la façon de penser des meilleurs spécialistes afin d'améliorer l'efficacité du diagnostic et du traitement des maladies cardiovasculaires. Lors de la conférence de lancement, le professeur Ge Junbo, académicien de l'Académie chinoise des sciences et chef du département de cardiologie, a déclaré que le grand modèle Guanxin ne se contentait pas d'introduire des données dans l'IA.

Feb 26, 2025

Recherche : le modèle o1-preview d'OpenAI surpasse les médecins dans le diagnostic de cas médicaux complexes

Une nouvelle étude suggère que le système d'intelligence artificielle o1-preview d'OpenAI pourrait surpasser les médecins humains dans le diagnostic de cas médicaux complexes. Une équipe de recherche de la Harvard Medical School et de l'Université de Stanford a soumis o1-preview à des tests de diagnostic médical complets, révélant des progrès significatifs par rapport aux versions précédentes. Selon les résultats, o1-preview a atteint un taux de diagnostic correct de 78,3 % sur tous les cas testés. Dans une comparaison directe sur 70 cas spécifiques, le système...

Dec 25, 2024

3.0k

Le modèle o1 d'OpenAI dévoilé : capacités exceptionnelles, traitement de 200 000 jetons

Récemment, un utilisateur a révélé sur le réseau social X qu'OpenAI avait brièvement rendu accessible son nouveau modèle o1 via l'URL "chatgpt.com/?model=o1" à certains utilisateurs, avant de rapidement le désactiver. Selon les retours utilisateurs, ce dernier modèle peut traiter environ 200 000 mots de texte et possède la capacité d'analyser des images. OpenAI qualifie le modèle o1 de "son modèle le plus puissant", particulièrement adapté aux tâches nécessitant créativité et raisonnement de haut niveau.

Nov 4, 2024

3.4k

AMIE : Système d’intelligence artificielle pour le raisonnement et le dialogue en diagnostic médical

AMIE, développé par Google, est un système axé sur le raisonnement et le dialogue en diagnostic médical. AMIE peut aider à diagnostiquer des affections, mener des conversations naturelles avec les médecins et les patients, et apprendre et s’améliorer continuellement. AMIE peut améliorer la précision du diagnostic, évaluer les compétences de communication des médecins et simuler des conversations médicales réalistes. AMIE a montré des résultats prometteurs lors de tests, mais des recherches et des validations plus approfondies sont nécessaires pour garantir sa sécurité et sa fiabilité. L’objectif d’AMIE est d’offrir une communication médicale plus efficace, aidant les médecins à mieux comprendre les affections et à améliorer la précision des diagnostics.

Jan 17, 2024

710

Le diagnostic médical par IA est en pleine croissance, mais la précision reste un défi permanent

La précision du diagnostic médical par IA suscite encore de nombreux doutes et ne peut en aucun cas remplacer l'expérience des médecins. Résoudre le problème de l'acquisition de données médicales suffisantes est essentiel pour améliorer la précision du diagnostic médical par IA. La reconnaissance d'images et la recherche de nouveaux médicaments représentent les principales opportunités de croissance actuelles de l'IA dans le domaine médical. Avec les progrès technologiques et l'accumulation de données, la précision du diagnostic médical par IA devrait s'améliorer progressivement. Le diagnostic médical par IA est en pleine croissance et son avenir est prometteur.

Oct 8, 2023

390

Ces plugins rendent votre ChatGPT 4.0 plus performant que la version Plus !

Découvrez un mini-programme ChatGPT officiel, une version chinoise de ChatGPT utilisable sur mobile sans VPN ni inscription. Nous recommandons l'extension KeepChatGPT pour résoudre les erreurs réseau et les interruptions de conversation. Les plugins GPT-EZ et Voice Control offrent des options de personnalisation et de saisie vocale supplémentaires.

Aug 21, 2023

540

SEO AIGC : Comment faire écrire à ChatGPT dans le style et le ton de votre auteur préféré

{Point 1 : Apprenez à utiliser ChatGPT pour imiter le style d'écriture et le ton de vos auteurs préférés. Point 2 : Générez du contenu dans un style similaire en faisant imiter à ChatGPT des extraits de l'écriture de vos auteurs préférés. Point 3 : Attention à l'utilisation abusive de l'IA pour créer du contenu en masse, afin d'éviter les problèmes de référencement et de sécurité du site web.}

Aug 14, 2023

260

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu