OpenAI的通用推理模型在没有人类指导的情况下,独立解决了组合几何领域困扰学界80年的埃尔德什单位距离猜想。该问题由数学家埃尔德什于1946年提出,核心是探究平面上n个点之间最多能有多少对距离为1的单位距离对。
Anthropic 的Claude Mythos模型通过巧妙证明解决了组合几何领域的百年难题——Erdős单位距离猜想,紧随OpenAI的GPT-5.5之后。这一突破采用智能体协同范式,而非传统单一模型,标志着AI在纯数学发现领域的竞争白热化。
菲尔兹奖得主高尔斯教授使用未公开的ChatGPT 5.5 Pro,在一小时内解决了一个长期悬而未决的组合数学难题。这一突破挑战了学界对大模型只能“背书”而非真正理解高深数学的传统认知,引发对AI数学能力的重新审视。
剑桥大学数学教授、菲尔兹奖得主 Timothy Gowers 分享使用未公开的 ChatGPT 5.5 Pro 进行数学研究的经历。该AI模型在一小时内解决了一个组合数学开放性问题,引发学术界对AI数学能力的关注。Gowers指出,大语言模型在数学领域的应用已从早期只能寻找已知信息,发展到能解决开放性问题。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
Moonshot
Bytedance
$0.8
32
Mungert
OpenReasoning-Nemotron-1.5B是基于Qwen2.5-1.5B-Instruct的后训练推理模型,专门用于数学、代码和科学解决方案的推理生成。该模型在多个推理基准测试中表现出色,支持GenSelect推理模式,能够并行生成多个解决方案并组合最优结果。
PictMCP是一个MCP服务器,为使用AI助手设计测试用例的软件开发者提供可靠、算法正确的成对测试生成。它利用WebAssembly本地运行微软PICT算法,将AI的思考与组合数学计算分离,确保测试生成的确定性和正确性。