Récemment, le modèle de grande intelligence artificielle Baichuan a officiellement lancé sa dernière version dédiée au secteur médical, le Baichuan-M2Plus, tout en mettant à jour l'application associée Baixiaoying et en ouvrant des interfaces API. Cette publication marque un autre progrès important depuis le lancement open source de Baichuan-M2 en août. Selon les tests, le M2Plus présente des performances remarquables en matière de taux d'erreurs médicales (« hallucinations »), qui sont nettement inférieures à ceux des grands modèles généraux, notamment trois fois moins que les produits médicaux existants comme DeepSeek, et même supérieur à l'application médicale américaine très populaire OpenEvidence.

QQ20251022-150030.png

Le M2Plus, grâce à son paradigme innovant de raisonnement basé sur six sources (EAR), est devenu « le ChatGPT pour médecins ». Ce modèle vise à résoudre les difficultés d'application dans des scénarios médicaux sérieux en intégrant des études originales, des revues de preuves, des normes de recommandations, des connaissances pratiques, de l'éducation publique en santé et des informations du monde réel réglementaires, afin de construire un système complet de connaissances médicales, garantissant ainsi la crédibilité et la scientificité des décisions médicales.

Dans le domaine de la recherche fondée sur des preuves, le M2Plus utilise le cadre PICO pour transformer les requêtes médicales en problèmes structurés, assurant ainsi l'exactitude et la fiabilité des informations récupérées. La conception unique de ce modèle permet également aux médecins d'accéder à des preuves médicales de haut niveau et fiables lorsqu'ils font face à des questions médicales complexes, améliorant ainsi considérablement l'efficacité de l'utilisation des informations médicales.

Plus important encore, le mécanisme de « formation renforcée par des preuves » du M2Plus lorsqu'il répond aux questions médicales permet au modèle de fournir des réponses non seulement basées sur les preuves récupérées, mais aussi d'éviter efficacement la génération aléatoire d'informations. En renforçant la citation de documents autorisés et en évaluant la qualité des preuves, le M2Plus montre une crédibilité comparable à celle des experts cliniques expérimentés lors de son utilisation pratique.

QQ20251022-150040.png

Dans plusieurs tests en milieu médical, les performances du M2Plus ont reçu des éloges élevés des médecins cliniques, notamment en analyse des antécédents médicaux, en raisonnement diagnostique et en propositions thérapeutiques, où ses réponses ont été largement reconnues pour leur précision et leur professionnalisme. Plus impressionnant encore, le M2Plus a obtenu un score exceptionnel de 97 lors de l'examen américain des médecins (USMLE), montrant ainsi une supériorité dans sa capacité à appliquer les connaissances médicales.

Le lancement du modèle de grande intelligence artificielle Baichuan a non seulement apporté un nouveau dynamisme à la transformation numérique du secteur médical chinois, mais représente également une percée supplémentaire de la Chine dans le domaine mondial des grands modèles. Avec le lancement du M2Plus, on s'attend à ce qu'il ait un impact profond sur la scientificté et l'efficacité des décisions cliniques.