人工智能在数学领域取得重大突破,GPT5.2模型仅用15分钟便证明了保罗·埃尔德什遗留的未解难题,并通过形式化工具验证。埃尔德什的千余猜想曾被视为人类智慧边界,但近期已有15个问题被解决,其中11个由AI完成。
OpenAI的GPT-5Pro通过截图识别出埃尔德什问题#339早在2003年已有证明论文,这一发现震惊数学界。该数论难题由保罗·埃尔德什提出,核心探讨自然数集合A作为r阶基时,能否确保用其中r个元素覆盖特定数学性质。22年前已解决的悬案凸显AI在学术检索中的突破潜力。
陶哲轩与GPT-5Pro合作攻克三年未解的微分几何难题,证明三维空间中主曲率绝对值不超过1的光滑拓扑球面,其包围体积不小于单位球体积。这一突破展示了AI推动数学研究与人机协同的新范式。
OpenAI研究人员透露GPT-5Pro在阅读数学论文后独立推导出更精确结论并完成证明,引发全网热议,推文阅读量超230万次。
Goedel-Prover 是一款开源的自动化定理证明模型,专注于数学问题的形式化证明。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Moonshot
Bytedance
$0.8
32
deepseek-ai
专为Lean 4形式化定理证明设计的开源大语言模型,通过递归定理证明流程收集数据,结合非正式和形式化的数学推理。
ByteDance-Seed
BFS-Prover是Lean4中最先进的定理证明系统,基于Qwen2.5-Math-7B大语言模型开发,能够根据Lean4中的证明状态自动生成策略,逐步推进数学定理的证明过程。
internlm
InternLM-Step-Prover 是一款基于 7B 语言模型的先进 LEAN4 步骤证明器,在 Lean-Github 和多个合成数据集上训练,在 MiniF2F、ProofNet 和 Putnam 等数学基准测试中表现出色,展示了强大的形式化数学证明能力。
InternLM-Math-Plus 是最先进的双语开源数学推理大语言模型,具备求解、证明、验证和增强能力。
InternLM-Math-Plus 是最先进的双语开源数学推理大语言模型,具备求解、证明、验证和增强等功能,为数学推理领域提供强大支持。
LoneStriker
InternLM-Math是由上海人工智能实验室开发的最先进的双语开源数学推理大语言模型。它在数学推理任务上表现卓越,支持多种数学问题的解决和证明,还可作为奖励模型使用,同时具备数据增强和代码解释等实用功能。