AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

領先 AI 模型在複雜物理任務中表現不佳,仍需人類助力

全球50多位物理學家聯合開發“CritPt”基準測試,評估AI模型處理未公開復雜物理問題的能力,模擬博士研究生獨立研究水平。儘管谷歌Gemini3Pro和OpenAI GPT-5被寄予厚望,但結果令人失望,Gemini3Pro準確率僅9.1%,突顯AI在高級科研任務中的侷限。

4.3k 4 分鐘前
領先 AI 模型在複雜物理任務中表現不佳,仍需人類助力

AI 離諾獎有多遠?頂級模型在博士級物理基準測試“CritPt”中慘敗,準確率不足10%

最新物理基準測試“CritPt”顯示,頂尖AI模型如Gemini3Pro和GPT-5距離成爲自主科學家仍有巨大差距。該測試由全球50多位物理學家開發,重點考覈博士級科研實戰能力,而非單純知識記憶,突顯AI在創造性研究中的侷限性。

6.7k 4 分鐘前
AI 離諾獎有多遠?頂級模型在博士級物理基準測試“CritPt”中慘敗,準確率不足10%
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖