AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

Gemini-2.5-pro在MathArena評測中展現卓越數學能力 遠超其他模型

2025年4月3日消息:根據MathArena最新發布的大語言模型數學能力評測結果顯示,Google的Gemini-2.5-pro以絕對優勢領跑,在未污染的高難度數學競賽中展現出令人矚目的表現。突破性成績Gemini-2.5-pro在MathArena平臺的嚴格評測中取得了24.40%的準確率,這一成績不僅位居榜首,更是與第二名DeepSeek-R1 的4.76%形成鮮明對比,領先優勢達到驚人的五倍之多。這一突破性成績表明Gemini-2.5-pro在高級數學推理能力上實現了質的飛躍。多項競賽中的優異表現特別值得關注的是,Gemini-2.5-pro在"AIME 2025 I"競賽測試中取

14.6k 3 天前
Gemini-2.5-pro在MathArena評測中展現卓越數學能力 遠超其他模型
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖