DeepSeek发布V3.2标准版与深度思考版。评测显示,V3.2在128k上下文场景下与GPT-5互有胜负;深度思考版在多项基准测试中与Gemini3Pro持平,并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术,通过优化token路由,显著降低了长文本的计算复杂度、显存占用,并提升了推理速度,首次在开源模型中实现了百万token的单卡推理能力。
字节跳动Seed团队研发的自动定理证明系统Seed-Prover在IMO2025比赛中表现亮眼,成功解决四道数学难题。该系统在几何题上仅用2秒完成证明,数论题则需3天并生成数千行证明,组合代数题还展现了创新解法。虽然比赛期间未能及时完成第一题,但赛后成功补证。目前该项目尚未开源模型权重,仅提供论文和项目资料。这一成果展示了AI在数学证明领域的潜力,为学术研究提供了新工具。
Tencent
$15
输入tokens/百万
$45
输出tokens/百万
4
上下文长度