OpenAI 發佈健康領域 AI 評估基準數據集HealthBench
OpenAI 正式發佈了一個大型數據集,旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench,專家們對這一開源數據和詳細的評估標準給予了高度讚譽,稱其在規模和廣度上都是 “前所未有” 的。圖源備註:圖片由AI生成,圖片授權服務商MidjourneyHealthBench 項目標誌着 OpenAI 在醫療健康領域的首次嘗試,尤其是在不依賴外部合作伙伴的情況下進行的創新探索。OpenAI 的健康 AI 團隊負責人卡蘭・辛格爾(Karan Singhal)表示:“我們的使命是確保人工通用智能(AGI)對人類