寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Apr 24, 2026

寒武纪今日宣布，已基于 vLLM 推理框架完成对深度求索（DeepSeek）最新开源模型DeepSeek-V4全系列的“Day0”适配。此次改装涵盖285B 参数的 Flash 版本及1.6T 参数的 Pro 版本，确保模型在发布当日即可在寒武纪硬件平台上稳定运行，相关改装代码已正式开源至 GitHub 社区。

针对DeepSeek-V4独有的稀疏注意力与压缩结构，寒武纪通过自研向量融合算子库 Torch-MLU-Ops 对 Compressor 等核心模块进行了专项加速。利用 BangC 高性能编程语言，寒武纪团队编写了稀疏 Attention 及 GroupGemm 等热点算子的极致优化内核，并于 vLLM 框架中全面支持 TP/PP/SP/DP/EP 五维混合并行策略、低精度量化及 PD 分离部署。这些技术手段在满足延迟约束的前提下，显著提升了端到端推理的词元吞吐能力。

硬件层面，寒武纪深度挖掘了 MLU 的访存与排序加速特性，有效应对DeepSeek-V4复杂的索引结构。凭借高互联带宽与低延迟通信优势，该方案最大化降低了 Prefill 与 Decode 场景下的通信损耗，提升了推理利用率。

行业分析指出，DeepSeek-V4凭借百万字（1M）超长上下文及顶尖的逻辑推理性能，对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配，不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力，也预示着国产 AI 产业链在软硬协同层面已进入成熟期，为大模型应用普惠提供了高效的算力底座支持。

寒武纪 vLLM DeepSeek-V4 Torch-MLU-Ops

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

DeepSeek梁文锋身价飙升至 360 亿美元，成AI公司新首富

梁文锋凭DeepSeek身价飙至360亿美元，成全球AI新首富，排名第63位，超越Anthropic和OpenAI创始人。其公司今年6月以4000亿元估值完成510亿元首轮融资。

2026年7月14号 17:08

440

DeepSeek完成74亿美元融资，梁文锋身家升至360亿美元

梁文锋因DeepSeek完成74亿美元融资，净资产暴增至360亿美元，跃升全球AI首富，超越Anthropic和OpenAI的创始人。DeepSeek估值达500亿美元，创AI模型企业融资纪录。

2026年7月14号 16:56

330

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型

快手KwaiKAT团队发布旗舰Agentic Coding模型KAT-Coder-Pro V2.5，直击“跑分高落地差”痛点。通过升级长程工程能力、通用Agentic能力及大规模Agentic强化学习体系，推动AI从单点代码补全迈向独立完成软件工程与复杂业务流。关键创新为自研AutoBuilder流水线，将运行仓库环境构建成训练支撑。

2026年7月10号 17:18

2.7k

三星开发4nm AI PC专用芯片“GAIA” 已向联想、惠普供样测试

三星推出代号“GAIA”的生成式AI加速芯片，以专用NPU切入AI PC市场。该芯片采用4纳米工艺和“存储中心型”架构设计，已向联想、惠普等厂商提供原型验证，目标2027年量产，是三星移动NPU技术向PC场景的延伸。

2026年7月10号 15:16

腾讯Hy3 编程评测出炉：参数只有对手五分之一，代码能力却与DeepSeek-V4-Pro打平

SuperCLUE公布腾讯Hy3语言模型编程专项测评，与DeepSeek-V4-Pro等对比。Hy3为MoE架构，总参数295B、激活仅21B，支持256K上下文，号称混元最强。结果参数远小却表现意外出色，从四大维度评估兼顾性能与花销，测评针对国内程序员日常写代码的真实场景。

2026年7月8号 17:00

1.7k

美国企业“弃用”头部AI：中国模型凭借高性价比突围

近期全球AI市场出现新动态：多家美国头部AI厂商调整定价，促使美国企业转向更具成本效益的方案。中国大模型凭借高性价比加速进入美国企业应用链。数据显示，自2月8日以来，美国企业调用DeepSeek、智谱GLM等国产模型的占比显著增长，尤其通过OpenRouter等聚合平台表现突出。

2026年7月8号 15:24

520

AI日报：Claude Code更新v2.1.202版本；支付宝AI开放平台开启邀测；xAI全面升级Grok Voice

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、ClaudeCode迎来v2.1.202更新：远程控制与工作流稳定性大幅提升ClaudeCodev2.1.202版本在工作流控制、远程协作和稳定性方面进行了深度优化，提升了开发者的使用体验和可靠性。7、AI有了“办公神器”：开源OfficeCLI让智能体自主驾驭文档OfficeCLI作为一款开源工具，为AI提供了强大的办公文档处理能力，其核心亮点在于高保真HTML渲染引擎和轻量化的运行方式，显著提升了AI在办公场景中的效率与准确性。

2026年7月7号 16:54

190

Claude Code 迎来 v2.1.202 更新：远程控制与工作流稳定性大幅提升

Claude Code v2.1.202版更新，修复诸多遗留问题，并深度优化工作流控制与远程协作体验，操作流畅度提升。新增/config中“动态工作流大小”设置，支持按需自定义智能体构建规模，赋予开发者更灵活的任务管控能力。

2026年7月7号 8:59

1.4k

降低数学科研门槛：Mistral AI 发布开源模型 Leanstral 1.5

Mistral AI发布专为Lean4设计的开源模型Leanstral1.5，采用Apache-2.0许可。该模型总参数119B，仅6B激活参数，兼顾高性能与低成本。在miniF2F形式数学基准中，验证集和测试集均达100%完成率，并已挑战Putnam等高难度推理任务。

2026年7月6号 17:44

920

谷歌跳票之后终定档：Gemini 3.5 Pro七月硬刚DeepSeek V4，全新底座不再"挤牙膏"

谷歌Gemini 3.5 Pro原定6月发布却跳票，期间多位核心AI研究员离职投奔对手，团队士气低落。现确认7月17日正式亮相，正好撞上国产大模型DeepSeek V4预计的7月中旬发布时间，两家中外旗舰模型将正面交锋，上演硬碰硬对决。

2026年7月6号 15:18

4.8k

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

GEO 品牌全景分析

GEO 品牌得分检测

GEO 排名查询

GEO 排名监测

AI 对话问题挖掘

GEO 推广链接检测

站点AI友好度检测

GEO排名优化系统源码

GEO 排名优化服务

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

大模型API聚合平台

模型库

模型供应商

大模型排行榜

大模型API中转站检测

大模型选型对比

大模型费用计算器

大模型竞技场

模型个人电脑配置检测器

模型部署服务器配置计算器

寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

DeepSeek梁文锋身价飙升至 360 亿美元，成AI公司新首富

DeepSeek完成74亿美元融资，梁文锋身家升至360亿美元

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型

三星开发4nm AI PC专用芯片“GAIA” 已向联想、惠普供样测试

腾讯Hy3 编程评测出炉：参数只有对手五分之一，代码能力却与DeepSeek-V4-Pro打平

美国企业“弃用”头部AI：中国模型凭借高性价比突围

AI日报：Claude Code更新v2.1.202版本；支付宝AI开放平台开启邀测；xAI全面升级Grok Voice

Claude Code 迎来 v2.1.202 更新：远程控制与工作流稳定性大幅提升

降低数学科研门槛：Mistral AI 发布开源模型 Leanstral 1.5

谷歌跳票之后终定档：Gemini 3.5 Pro七月硬刚DeepSeek V4，全新底座不再"挤牙膏"

相关AI新闻推荐

DeepSeek梁文锋身价飙升至 360 亿美元，成AI公司新首富

DeepSeek完成74亿美元融资，梁文锋身家升至360亿美元

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型

三星开发4nm AI PC专用芯片“GAIA” 已向联想、惠普供样测试

腾讯Hy3 编程评测出炉：参数只有对手五分之一，代码能力却与DeepSeek-V4-Pro打平

美国企业“弃用”头部AI：中国模型凭借高性价比突围

AI日报：Claude Code更新v2.1.202版本；支付宝AI开放平台开启邀测；xAI全面升级Grok Voice

Claude Code 迎来 v2.1.202 更新：远程控制与工作流稳定性大幅提升

降低数学科研门槛：Mistral AI 发布开源模型 Leanstral 1.5

谷歌跳票之后终定档：Gemini 3.5 Pro七月硬刚DeepSeek V4，全新底座不再"挤牙膏"