Gemini-2.5-pro在MathArena評測中展現卓越數學能力 遠超其他模型
2025年4月3日消息:根據MathArena最新發布的大語言模型數學能力評測結果顯示,Google的Gemini-2.5-pro以絕對優勢領跑,在未污染的高難度數學競賽中展現出令人矚目的表現。突破性成績Gemini-2.5-pro在MathArena平臺的嚴格評測中取得了24.40%的準確率,這一成績不僅位居榜首,更是與第二名DeepSeek-R1 的4.76%形成鮮明對比,領先優勢達到驚人的五倍之多。這一突破性成績表明Gemini-2.5-pro在高級數學推理能力上實現了質的飛躍。多項競賽中的優異表現特別值得關注的是,Gemini-2.5-pro在"AIME 2025 I"競賽測試中取