Best 数学竞赛 AI Tools & Models - Premium 数学竞赛 News

AI News

10B 级“小核弹”:阶跃星辰开源 Step3-VL-10B，性能跨级挑战200B 大模型

阶跃星辰开源多模态视觉语言模型Step3-VL-10B，仅10B参数却在多项基准测试中表现卓越，解决了小模型智能水平不足的痛点。该模型在视觉感知、逻辑推理和数学竞赛等维度达到同规模最优，甚至超越规模大10至20倍的开源及闭源旗舰模型。

字节 Seed 新模型问世：数学竞赛金牌实力爆表，AI 推理迈入新阶段！

字节跳动Seed AI团队发布数学推理模型Seed Prover1.5，在国际数学奥林匹克竞赛中表现优异，获得金牌。该模型基于Scaling Law理论，仅用16.5小时便解决IMO2025前五题，仅失一题，以35分达到金牌标准，成绩与谷歌Gemini相当，相比此前模型效率大幅提升。

13.5k 23 hours ago

字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展

字节跳动Seed团队推出形式化数学推理模型Seed Prover1.5，通过大规模Agentic强化学习显著提升推理能力与效率。该模型在2025年国际数学奥林匹克竞赛中，三天内成功解决六题中的四道，并完成一道题的部分解答，展现强大性能。

14.1k 2 days ago

AI 科学研究新基准:FrontierScience 评估模型推理能力

AI模型在科学推理能力评估方面取得重要进展，已在国际数学和信息学奥林匹克竞赛中表现优异。随着GPT-5等先进模型的发展，AI正有效加速真实科学研究进程，展现出强大的假设提出、测试修正及跨领域综合能力。

12k yesterday

AI Products

PRIME-RL

PRIME通过隐式奖励增强在线强化学习，提升语言模型的推理能力。

模型训练与部署

11.3k

OpenAI o3

新一代最强推理模型

AI模型

12.1k

Numina Math 7B

数学领域的开源AI模型，助力数学竞赛。

研究工具

12.4k

NuminaMath

数学竞赛问题的解决方案集合

AI模型

11.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen-vl-plus

Alibaba

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

10B 级“小核弹”:阶跃星辰开源 Step3-VL-10B，性能跨级挑战200B 大模型

字节 Seed 新模型问世：数学竞赛金牌实力爆表，AI 推理迈入新阶段！

字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展

AI 科学研究新基准:FrontierScience 评估模型推理能力

AI Products

PRIME-RL

OpenAI o3

Numina Math 7B

NuminaMath

Models

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

qwen-vl-plus

Qianfan-VL-8B

Qianfan-VL-70B

VibeThinker 1.5B F32 GGUF

M1 3B

OpenMath Nemotron 14B Kaggle

Light R1 32B