菲尔兹奖得主高尔斯教授使用未公开的ChatGPT 5.5 Pro,在一小时内解决了一个长期悬而未决的组合数学难题。这一突破挑战了学界对大模型只能“背书”而非真正理解高深数学的传统认知,引发对AI数学能力的重新审视。
剑桥大学数学教授、菲尔兹奖得主 Timothy Gowers 分享使用未公开的 ChatGPT 5.5 Pro 进行数学研究的经历。该AI模型在一小时内解决了一个组合数学开放性问题,引发学术界对AI数学能力的关注。Gowers指出,大语言模型在数学领域的应用已从早期只能寻找已知信息,发展到能解决开放性问题。
OpenAI的GPT-5在海法大学与思科联合研究中取得重大突破,首次通过哥德尔测试,并成功破解三大组合优化数学猜想。该研究设计了五项复杂测试任务,GPT-5凭借强大逻辑推理能力攻克其中三项,展现了AI在数学研究领域的巨大潜力,令研究人员感到惊讶。
字节跳动Seed团队研发的自动定理证明系统Seed-Prover在IMO2025比赛中表现亮眼,成功解决四道数学难题。该系统在几何题上仅用2秒完成证明,数论题则需3天并生成数千行证明,组合代数题还展现了创新解法。虽然比赛期间未能及时完成第一题,但赛后成功补证。目前该项目尚未开源模型权重,仅提供论文和项目资料。这一成果展示了AI在数学证明领域的潜力,为学术研究提供了新工具。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
Moonshot
Bytedance
$0.8
32
Mungert
OpenReasoning-Nemotron-1.5B是基于Qwen2.5-1.5B-Instruct的后训练推理模型,专门用于数学、代码和科学解决方案的推理生成。该模型在多个推理基准测试中表现出色,支持GenSelect推理模式,能够并行生成多个解决方案并组合最优结果。
PictMCP是一个MCP服务器,为使用AI助手设计测试用例的软件开发者提供可靠、算法正确的成对测试生成。它利用WebAssembly本地运行微软PICT算法,将AI的思考与组合数学计算分离,确保测试生成的确定性和正确性。