近日,阶跃星辰(StepFun)正式推出了全新的深度研究智能体模型——

与市面上常见的、主要针对短问题检索优化的 Web Agent 不同,
为了让 AI 具备像人类专家一样的研究水平,
目前,该模型在 Scale AI 的研究评测指标中达到了61.42% 的依从率,表现足以媲美 OpenAI 和 Google 的同类深度研究系统。而在阶跃星辰自有的 ADR-Bench 中文基准测试中,这款32B 模型甚至超越了部分更大规模的开源模型,展现出极高的实用价值和成本优势。
论文:https://arxiv.org/pdf/2512.20491
划重点:
🧠 单智能体架构:
将规划、搜索、验证和撰写内化为单一模型的原子能力,无需调用多个外部智能体,显著提升效率并降低成本。Step-DeepResearch 📚 深度科研导向:不同于简单的问答检索,该模型支持长达128k 的上下文,能够从超过2000万篇论文和权威索引中获取信息,生成严谨的结构化报告。
🏆 性能表现强劲:在多项深度研究评测中表现优异,其32B 的体量实现了可比肩大参数量闭源模型的专业研究水准。



