OpenAI的GPT-5Pro通过截图识别出埃尔德什问题#339早在2003年已有证明论文,这一发现震惊数学界。该数论难题由保罗·埃尔德什提出,核心探讨自然数集合A作为r阶基时,能否确保用其中r个元素覆盖特定数学性质。22年前已解决的悬案凸显AI在学术检索中的突破潜力。
陶哲轩与GPT-5Pro合作攻克三年未解的微分几何难题,证明三维空间中主曲率绝对值不超过1的光滑拓扑球面,其包围体积不小于单位球体积。这一突破展示了AI推动数学研究与人机协同的新范式。
OpenAI研究人员透露GPT-5Pro在阅读数学论文后独立推导出更精确结论并完成证明,引发全网热议,推文阅读量超230万次。
字节跳动Seed团队研发的自动定理证明系统Seed-Prover在IMO2025比赛中表现亮眼,成功解决四道数学难题。该系统在几何题上仅用2秒完成证明,数论题则需3天并生成数千行证明,组合代数题还展现了创新解法。虽然比赛期间未能及时完成第一题,但赛后成功补证。目前该项目尚未开源模型权重,仅提供论文和项目资料。这一成果展示了AI在数学证明领域的潜力,为学术研究提供了新工具。
Goedel-Prover 是一款开源的自动化定理证明模型,专注于数学问题的形式化证明。
deepseek-ai
专为Lean 4形式化定理证明设计的开源大语言模型,通过递归定理证明流程收集数据,结合非正式和形式化的数学推理。
ByteDance-Seed
BFS-Prover是Lean4中最先进的定理证明系统,基于Qwen2.5-Math-7B大语言模型开发,能够根据Lean4中的证明状态自动生成策略,逐步推进数学定理的证明过程。
internlm
InternLM-Step-Prover 是一款基于 7B 语言模型的先进 LEAN4 步骤证明器,在 Lean-Github 和多个合成数据集上训练,在 MiniF2F、ProofNet 和 Putnam 等数学基准测试中表现出色,展示了强大的形式化数学证明能力。
InternLM-Math-Plus 是最先进的双语开源数学推理大语言模型,具备求解、证明、验证和增强能力。
InternLM-Math-Plus 是最先进的双语开源数学推理大语言模型,具备求解、证明、验证和增强等功能,为数学推理领域提供强大支持。