DeepSeek创始人梁文锋近日宣布,新一代旗舰模型DeepSeek V4将于2026年4月下旬发布。在此之前,产品已引入分层模式:快速模式主打日常对话和即时响应,支持图片和文件文字识别;专家模式则专注于复杂逻辑和深度思考,能力更强。
DeepSeek创始人梁文锋近日透露,新一代旗舰大模型DeepSeek V4拟定于2026年4月下旬发布,标志着国产大模型在万亿级参数赛道迎来关键突破。近期网页端已上线“快速模式”与“专家模式”,通过差异化交互完成发布前实战预演。技术层面,V4预计将实现万亿级参数规模及百万级上下文窗口。
DeepSeek V4正进行灰度测试,界面显示模型在架构、交互和多模态能力上均有突破。核心亮点是“三足鼎立”的新功能架构:快速版侧重轻量化日常响应,标准版平衡性能与效率,专业版则面向复杂任务。这标志着产品矩阵的全面进化。
DeepSeek推出全新“专家模式”,首次引入模式分层设计。用户可在“快速模式”和“专家模式”间切换。快速模式适用于日常对话,响应迅速,支持图片和文件文字识别。专家模式则专注于深入解决复杂问题,提升处理专业任务的体验。
Alibaba
$4
Input tokens/M
$16
Output tokens/M
1k
Context Length
$6
$24
256
Baidu
-
128
Deepseek
$12
32
$0.75
Openai
$8.75
$70
400
$2
64
$0.63
$3.15
131
$1
Chatglm
$8
$0.3
DavidAU
基于OpenAI的gpt-oss-120b模型优化的大型语言模型,使用NEO数据集进行性能提升,支持多场景应用,可在CPU、GPU或部分卸载模式下运行,具有128k上下文长度和最多128个专家的混合专家架构。
cpatonn
Qwen3-30B-A3B-Instruct-2507是阿里云推出的305亿参数混合专家模型,采用非思考模式,在指令遵循、逻辑推理、文本理解、数学科学、编码和工具使用等方面表现优异,支持262K长上下文和多语言处理。
QuixiAI
Qwen3-30B-A3B-AWQ是基于Qwen3-30B-A3B模型的AWQ量化版本,是通义系列最新一代大语言模型。该模型采用专家混合(MoE)架构,支持思考模式和非思考模式的双模式切换,在推理、指令遵循、智能体能力和多语言支持方面表现优异。
nbeerbower
HeroBophades-3x7B是一个基于mergekit构建的实验性专家混合(LLM)模型,设计为在12GB显存的GPU上以4位模式运行。
Pearl MCP Server是一个标准化的AI与专家服务接口实现,支持通过MCP协议与各类客户端交互,提供AI自动应答、AI辅助专家和直接专家咨询三种服务模式。