OpenAI發佈o3:AI 推理能力的重大突破,得分高達 87.5%
OpenAI 正式發佈了其最新的 o-Model 推理系列模型 ——OpenAI o3。作爲繼任者,o3在數學和科學推理方面展現了顯著的進步,引發了業界對其能力與侷限性的廣泛討論。OpenAI 表示,o3的設計旨在提升處理結構化思維需求的推理能力,尤其是在數學和科學領域。該模型在一項專門的推理基準測試 ARC AGI 中表現優異,得分從之前模型的32% 躍升至87%。這一進步標誌着 o3在解決複雜邏輯和數學問題上的能力有了顯著提升。o3的性能表現尤爲引人關注。在高級數學測試中,o3的成功率達到96.7%,相比之前的