Le PDG de Microsoft, Satya Nadella, a récemment annoncé sur une plateforme de médias sociaux que Microsoft lançait officiellement un système révolutionnaire d'intelligence artificielle médicale intitulé MAI-DxO. Ce système innovant se distingue par son design unique de type "indépendant du modèle", permettant une adaptation flexible à différents modèles linguistiques des fabricants et de leurs capacités, améliorant ainsi généralement les performances de diagnostic. Plus encourageant encore, le MAI-DxO ne simule pas seulement le processus de diagnostic d'un médecin réel, mais il a également démontré, lors des tests, une précision diagnostique bien supérieure à celle des médecins professionnels, tout en réduisant significativement les coûts liés au diagnostic médical.

Les données de test publiées par Microsoft montrent qu'avec un ensemble de 56 cas cachés du journal New England Journal of Medicine, la précision moyenne des 21 médecins expérimentés de plus de dix ans n'était que de 19,9 %. Cependant, le MAI-DxO atteint une précision de 81,9 % en utilisant le modèle o3 d'OpenAI sans budget, et même 85,5 % en mode intégré, ce qui est plus de quatre fois supérieur à la précision des médecins professionnels.

L'innovation principale du MAI-DxO réside dans son simulacre du mode de collaboration d'une équipe médicale réelle, en faisant travailler ensemble une série de médecins virtuels ayant des rôles différents pour résoudre les problèmes de diagnostic. Ainsi, une amélioration notable a été obtenue en termes de précision diagnostique et d'efficacité économique. Cette équipe virtuelle inclut le Dr. Hypothesis, chargé de maintenir et de mettre à jour la liste des diagnostics différentiels ; le Dr. Test-Chooser, qui sélectionne à chaque tour les examens les plus discriminants ; le Dr. Challenger, qui agit comme superviseur, identifie les biais et propose des suggestions provocatrices ; le Dr. Stewardship, qui promeut l'efficacité économique et optimise les protocoles d'examen ; et le Dr. Checklist, chargé du contrôle qualité en arrière-plan et assurant la cohérence des raisonnements.

Pour s'adapter aux besoins variés des scénarios médicaux en matière de coût, d'efficacité et de précision, le MAI-DxO propose cinq modes d'intégration. Ces modes comprennent le mode Instant Answer, qui permet un diagnostic rapide basé uniquement sur un résumé initial du cas, adapté aux situations d'urgence ou aux environnements pauvres en ressources ; le mode Question Only, qui diagnostique uniquement par des questions, imitant la consultation initiale ; le mode Budgeted, qui intègre un mécanisme de contrôle budgétaire dynamique ; le mode No Budget, axé sur la maximisation de la précision diagnostique, adapté aux cas complexes ; et le mode Ensemble, qui améliore davantage la précision diagnostique en simulant le travail simultané de plusieurs équipes de médecins.

Avec le lancement du MAI-DxO, Microsoft a également lancé un benchmark professionnel intitulé SDBench