Best 数学证明 AI Tools & Models - Premium 数学证明 News

AI News

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

欧洲Mistral AI推出数学形式化证明模型Leanstral 1.5，专为Lean4语言，总参数119B但推理仅激活6B，以极低开销和Apache-2.0许可完全开源。在miniF2F基准上验证集和测试集均达100%完成率，PutnamBench同样表现惊人。

14k 3 hours ago

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

Anthropic 推出 Claude Mythos，凭借简明证明攻克 Erdős 数学猜想

Anthropic 的Claude Mythos模型通过巧妙证明解决了组合几何领域的百年难题——Erdős单位距离猜想，紧随OpenAI的GPT-5.5之后。这一突破采用智能体协同范式，而非传统单一模型，标志着AI在纯数学发现领域的竞争白热化。

14.7k 11 hours ago

Anthropic 推出 Claude Mythos，凭借简明证明攻克 Erdős 数学猜想

数学界变天！OpenAI推理模型推翻 80 年几何猜想，AI首次自主证明Erdős开放问题

OpenAI最新推理模型成功推翻数学家保罗·Erdős在1946年提出的单位距离猜想，首次依靠自身长链推理能力自主攻克数学核心开放难题。这一里程碑式突破经专家独立验证，标志着人工智能从检索式解答迈入原创性证明阶段。

17.8k just now

数学界变天！OpenAI推理模型推翻 80 年几何猜想，AI首次自主证明Erdős开放问题

ChatGPT-5.2 首次独立证明数学猜想，开启“氛围证明”时代

比利时布鲁塞尔自由大学研究发现，商用大模型已能独立生成原创数学证明。ChatGPT-5.2成功破解了2024年提出的数学猜想，标志着大语言模型能力超越代码辅助和文本创作，进入需要极强逻辑推理的数学领域。

16.3k 10 hours ago

AI Products

Goedel-Prover

Goedel-Prover 是一款开源的自动化定理证明模型，专注于数学问题的形式化证明。

研究工具

11k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen-vl-plus

Alibaba

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

Anthropic 推出 Claude Mythos，凭借简明证明攻克 Erdős 数学猜想

数学界变天！OpenAI推理模型推翻 80 年几何猜想，AI首次自主证明Erdős开放问题

ChatGPT-5.2 首次独立证明数学猜想，开启“氛围证明”时代

AI Products

Goedel-Prover

Models

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

qwen-vl-plus

Qianfan-VL-8B

Qianfan-VL-70B

DeepSeek Prover V2 671B

BFS Prover V1 7B

Internlm2 Step Prover

Internlm2 Math Plus 7b

Internlm2 Math Plus 1_8b

Internlm2 Math 20b Llama GGUF