最好的HealthBench AI工具模型_精選HealthBench資訊

AI資訊

百川智能發佈M4 模型，實現“真人醫生”式主動問診

百川智能與清華團隊發佈醫療大模型Baichuan-M4，在權威HealthBench評測中包攬三項子榜單第一，表現超越GPT-5.5。其核心突破在於徹底變革交互模式，實現更貼近臨牀的智能診療能力。

15.1k 39 分鐘前

醫療AI新高地：百川智能發佈M4 模型，實現“真人醫生”式主動問診

百川智能與清華髮布醫療大模型Baichuan-M4，在HealthBench及其Hard、Professional三項評測中奪冠，性能超越GPT-5.5。其核心突破在於交互模式革新，結合強大推理與臨牀知識，探索醫療垂直領域應用。

13k 39 分鐘前

反超OpenAI！百川智能開源醫療大模型 Baichuan-M2能力全球登頂

百川智能發佈開源醫療大模型Baichuan-M2，在HealthBench評測中以60.1分超越OpenAI等競爭對手，成爲全球領先的開源醫療模型。該模型採用輕量化設計，支持RTX4090單卡部署，成本較同類方案降低57倍，並推出優化版本提升74.9%處理速度。特別注重醫療隱私需求，支持私有化部署。研究發現其醫療數據訓練不僅未削弱通用能力，反而提升了數學、寫作等表現。在複雜醫療問題處理上達到GPT-5水平，成爲全球第二款HealthBench Hard評分超32分的模型。

13.3k 1 天前

OpenAI 發佈健康領域 AI 評估基準數據集HealthBench

OpenAI 正式發佈了一個大型數據集，旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench，專家們對這一開源數據和詳細的評估標準給予了高度讚譽，稱其在規模和廣度上都是 “前所未有” 的。圖源備註：圖片由AI生成，圖片授權服務商MidjourneyHealthBench 項目標誌着 OpenAI 在醫療健康領域的首次嘗試，尤其是在不依賴外部合作伙伴的情況下進行的創新探索。OpenAI 的健康 AI 團隊負責人卡蘭・辛格爾（Karan Singhal）表示:“我們的使命是確保人工通用智能(AGI)對人類

14.3k 8 小時前