DeepSeek發佈V3.2標準版與深度思考版。評測顯示,V3.2在128k上下文場景下與GPT-5互有勝負;深度思考版在多項基準測試中與Gemini3Pro持平,並在IMO2025盲測中達到金牌分數線。核心升級是轉正稀疏注意力技術,通過優化token路由,顯著降低了長文本的計算複雜度、顯存佔用,並提升了推理速度,首次在開源模型中實現了百萬token的單卡推理能力。
字節跳動Seed團隊研發的自動定理證明系統Seed-Prover在IMO2025比賽中表現亮眼,成功解決四道數學難題。該系統在幾何題上僅用2秒完成證明,數論題則需3天並生成數千行證明,組合代數題還展現了創新解法。雖然比賽期間未能及時完成第一題,但賽後成功補證。目前該項目尚未開源模型權重,僅提供論文和項目資料。這一成果展示了AI在數學證明領域的潛力,爲學術研究提供了新工具。
Tencent
$15
輸入tokens/百萬
$45
輸出tokens/百萬
4
上下文長度