DeepSeek发布V3.2标准版与深度思考版。评测显示,V3.2在128k上下文场景下与GPT-5互有胜负;深度思考版在多项基准测试中与Gemini3Pro持平,并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术,通过优化token路由,显著降低了长文本的计算复杂度、显存占用,并提升了推理速度,首次在开源模型中实现了百万token的单卡推理能力。
12月1日,中国AI公司深度求索发布DeepSeek-V3.2系列模型,包括标准版和高计算增强版。该系列采用创新的稀疏注意力机制(DSA),首次实现细粒度稀疏注意力,有效降低长文本处理的计算成本。模型强化了Agent能力,旨在挑战GPT-5和Gemini 3.0 Pro等全球顶级AI模型。
谷歌发布Imagen4文本转图像模型,通过Gemini API和AI Studio开放。新版本显著提升文本渲染性能,包含三个版本:标准版提升图像生成质量和文本准确性;Imagen4Fast版针对快速生成需求优化。
GitHub泄露文档显示OpenAI将推出GPT-5系列四款模型:主打逻辑推理的标准版、轻量mini版、低延迟nano版和企业级chat版。新模型在代码生成和推理能力上有提升,但内部测试表明性能增幅不及GPT-3到GPT-4的飞跃。此前GPT-4.5因表现不佳被放弃,而GPT-5试图通过动态资源分配机制,在高级推理与日常对话间取得平衡。这次升级更偏向渐进式改进,实际效果尚待验证。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
$1.75
$14
400
Tencent
$0.8
$2
30
$0.5
250
-
mrm8488
基于BETO模型通过蒸馏技术优化的西班牙语问答模型,比标准版更轻量高效