最近、百川大モデルは最新の医療大モデルである「Baichuan-M2Plus」を正式に発表し、関連アプリケーションの「百小应( Bai Xiao Ying)」も同時にアップグレードされ、APIインターフェースがオープンになりました。このリリースは、8月にBaichuan-M2をオープンソース化して以来の重要な進展です。評価によると、M2Plusは医療に関する幻覚率が優れ、一般的な大規模モデルと比べて顕著に低下しており、特に既存の医療製品であるDeepSeekと比較して約3倍低いだけでなく、米国で人気のある医療アプリケーションOpenEvidenceを上回っています。

QQ20251022-150030.png

M2Plusは、革新的な6源循証推論(EAR)パラダイムにより、「医師向けChatGPT」として知られています。このモデルは、重大な医療シーンでの応用課題に対処するために、原始研究、証拠のレビュー、ガイドラインの規範、実践知識、公衆健康教育および規制の現実世界情報を取り込み、完全な医学知識体系を構築し、医療決定の信頼性と科学性を確保しています。

循証検索においては、M2PlusはPICOフレームワークを使用し、医療質問を構造化された問題に変換することで、取得する情報の正確さと信頼性を保証します。このモデルの独自設計により、医師が複雑な医療問題に直面した際に、高レベルで信頼できる医学的証拠を得ることができ、医療情報の利用効率を大幅に向上させます。

さらに重要的是には、M2Plusが医療質問に答える際の「循証強化トレーニング」メカニズムにより、モデルの回答は検索された証拠に基づいており、無作為に情報を生成するのを効果的に回避しています。権威ある資料の引用と証拠の質の評価を通じて、M2Plusは実際の応用において熟練した臨床専門家と同等の信頼性を示しています。

QQ20251022-150040.png

医療シーンでの複数のテストにおいて、M2Plusの性能は臨床医から高い評価を受けました。特に病歴の分析、診断の思考プロセス、治療計画に関して、その回答の正確さと専門性は広く認められています。驚くべきことに、米国の医師資格試験(USMLE)では、M2Plusは驚くほどの97点を達成し、医学知識の応用力の優れていることを示しています。