AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

AI評測新標杆!GPT-5等前沿模型慘遭零分,博士級推理能力究竟幾何?

FormulaOne AI評測基準引發關注,頂尖模型如GPT-5、Grok4等全部得零分。該基準由AAI推出,包含220個圖結構動態規劃問題,涵蓋拓撲、幾何和組合等複雜領域,難度從中等到科研級別。

18.5k 前天
AI評測新標杆!GPT-5等前沿模型慘遭零分,博士級推理能力究竟幾何?
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖