7月23日、クォークヘルス大規模モデルは中国の12の主要学門の主任医師試験に合格し、国内で初めてこの挑戦を完了した大規模モデルとなりました。現在、「主任級AI医師」の能力はクォークのAI検索に完全に統合されており、ユーザーが健康問題を検索する際には「詳細検索」を選択して呼び出すことができます。

これは5月に副主任医師資格試験に合格した後、クォークヘルス大規模モデルの能力がまた一歩進化したものです。専門分野モデルと汎用モデルの比較において、クォークヘルス大規模モデルは難易度が高いほど優位性が顕著になる性能曲線を示しており、複雑な医学的推論タスクにおける突破を示しています。

QQ20250723-133844.png

これは医学分野で専門分野モデルを開発することの大きな潜在力を示しています。クォークヘルス大規模モデルは通義千問をベースにし、垂直シナリオ向けの深く工程化された道を歩んでいます。「私たちはAIに医学的な質問に答えるように訓練しているのではなく、医学的思考を学ばせるように訓練しているのです」とクォークヘルスアルゴリズム担当の徐健氏は語っています。

クォークヘルス大規模モデルの重要な突破の一つは、「ゆっくり考える能力」の構築です。この能力は連鎖的な推論と多段階の臨床的推論経路モデリングを融合しており、複雑な医療問題に対処する際に段階的に、そして深く最終的な回答を導き出すことができます。

QQ20250723-133851.png

この「ゆっくり考える能力」を構築するためには、高品質な推論トレーニングデータが必要です。そのため、クォークは「二つのデータプロダクションライン+二つの報酬メカニズム」のエンジニアリングシステムを構築しました。一方では、医学データを「確認可能」と「確認不可能」の2種類に分けて、それぞれ診断関連のタスクと健康アドバイス関連のタスクに対応させています。他方では、トレーニング方法に「プロセス報酬モデル」と「結果報酬モデル」を導入し、モデルの推論プロセスの合理性と最終的な結論の正確性をそれぞれ評価することで、モデルの臨床的説明可能性と推論の一貫性を大幅に向上させています。

このシステムは、冷スタートデータの厳密な人工校正、複数ラウンドのサンプル選定と難易度順次訓練戦略、および「高得点詐欺」防止のための不正認識メカニズムを含む複数段階の強化学習プロセスを設計しています。本物の医師によるラベリングと「質問-思考-回答」のデータセットを駆動する強化学習を通じて、クォークヘルス大規模モデルは医学知識だけでなく、医学的思考の経路選択、証拠の統合、多解平衡の能力も学びました。下部の権威ある医学知識ベースにより、モデルが出力する内容は専門的かつ最新であることが保証されています。

安貞病院心臓外科の主任医師である謝進生氏は、「クォークは一部の問題に対して専門医よりも専門的な回答をしている」と述べています。このような成果の裏には、専門医師チームの深い参加があります。現在、クォークヘルス大規模モデルには千人規模の専門医師のラベリングチームがあり、そのうち400人以上は副主任医師以上の高度な資格を持つ医療専門家です。