Best AI数学推理 AI Tools & Models - Premium AI数学推理 News

AI News

降低数学科研门槛：Mistral AI 发布开源模型 Leanstral 1.5

Mistral AI发布专为Lean4设计的开源模型Leanstral1.5，采用Apache-2.0许可。该模型总参数119B，仅6B激活参数，兼顾高性能与低成本。在miniF2F形式数学基准中，验证集和测试集均达100%完成率，并已挑战Putnam等高难度推理任务。

14.6k 1 hours ago

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

欧洲Mistral AI推出数学形式化证明模型Leanstral 1.5，专为Lean4语言，总参数119B但推理仅激活6B，以极低开销和Apache-2.0许可完全开源。在miniF2F基准上验证集和测试集均达100%完成率，PutnamBench同样表现惊人。

14.1k 1 days ago

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

攻克悬置 56 年难题！谷歌AlphaProof Nexus颠覆数学界

谷歌DeepMind推出AI框架“AlphaProof Nexus”，通过四级智能体架构协同，在数学研究领域取得重大突破，成功解开两道悬而未决56年的埃尔德什难题。系统从基础模型与Lean编译器循环交互入手，逐步提升推理复杂度，展现了AI在形式化验证与数学推理中的强大潜力。

17k 6 hours ago

OpenAI 推理模型突破性进展：AI 成功反驳 Erdős 单位距离猜想

2026年5月20日，OpenAI的推理模型成功推翻数学大师保罗·Erdős于1946年提出的“单位距离猜想”，解决了离散几何领域近80年的核心难题。与以往不同，该成果获学术界广泛认可，标志着AI从“检索”到“原创”的关键突破。

32.7k 28 minutes ago

AI Products

Gpt 5 Ai

GPT 5是下一代AI模型，提供卓越的编码、数学和推理性能。

AI模型

11.7k

DeepSeek Japanese

DeepSeek 是一款先进的 AI 语言模型，擅长逻辑推理、数学和编程任务，提供免费使用。

AI模型

13k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

降低数学科研门槛：Mistral AI 发布开源模型 Leanstral 1.5

Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

攻克悬置 56 年难题！谷歌AlphaProof Nexus颠覆数学界

OpenAI 推理模型突破性进展：AI 成功反驳 Erdős 单位距离猜想

AI Products

Gpt 5 Ai

DeepSeek Japanese

Models

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen-image-edit

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

wan2.5-t2i-preview

Olmo 3 7B Instruct

Olmo 3 32B Think

Olmo 3 7B Instruct DPO

Olmo 3 7B Think DPO

Olmo 3 7B Think

Olmo 3 7B Instruct SFT

Olmo 3 7B RL Zero Math

Olmo 3 7B RL Zero IF

Olmo 3 7B RL Zero Mix

Olmo 3 32B Think DPO

Rnj 1

Olmo 3 7B Think SFT

Luth LFM2 350M

OpenMath Nemotron 14B Kaggle

GLM Z1 9B 0414

EXAONE Deep 2.4B GGUF

Glm 4 9b Hf

Glm 4 9b Hf

Llama3.2 Typhoon2 T1 3b Research Preview

Glm 4 9b Chat Hf