AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

领先 AI 模型在复杂物理任务中表现不佳,仍需人类助力

全球50多位物理学家联合开发“CritPt”基准测试,评估AI模型处理未公开复杂物理问题的能力,模拟博士研究生独立研究水平。尽管谷歌Gemini3Pro和OpenAI GPT-5被寄予厚望,但结果令人失望,Gemini3Pro准确率仅9.1%,突显AI在高级科研任务中的局限。

5.5k 9 分钟前
领先 AI 模型在复杂物理任务中表现不佳,仍需人类助力

AI 离诺奖有多远?顶级模型在博士级物理基准测试“CritPt”中惨败,准确率不足10%

最新物理基准测试“CritPt”显示,顶尖AI模型如Gemini3Pro和GPT-5距离成为自主科学家仍有巨大差距。该测试由全球50多位物理学家开发,重点考核博士级科研实战能力,而非单纯知识记忆,突显AI在创造性研究中的局限性。

6.9k 9 分钟前
AI 离诺奖有多远?顶级模型在博士级物理基准测试“CritPt”中惨败,准确率不足10%
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图