寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型
针对
硬件层面,寒武纪深度挖掘了 MLU 的访存与排序加速特性,有效应对
行业分析指出,DeepSeek-V4凭借百万字(1M)超长上下文及顶尖的逻辑推理性能,对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配,不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力,也预示着国产 AI 产业链在软硬协同层面已进入成熟期,为大模型应用普惠提供了高效的算力底座支持。
寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型
针对
硬件层面,寒武纪深度挖掘了 MLU 的访存与排序加速特性,有效应对
行业分析指出,DeepSeek-V4凭借百万字(1M)超长上下文及顶尖的逻辑推理性能,对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配,不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力,也预示着国产 AI 产业链在软硬协同层面已进入成熟期,为大模型应用普惠提供了高效的算力底座支持。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

腾讯云在TokenHub平台推出DeepSeek-V4预览版API,支持百万级上下文长度,显著提升自然语言处理能力。定价与DeepSeek官方一致,提供高性价比服务,并在国际站新加坡节点同步上架,覆盖全球用户。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、DeepSeek-V4预览版正式发布:1M超长上下文进入全员普惠时代DeepSeek-V4预览版正式发布,具备1M超长上下文能力,并通过结构创新和Agent生态适配,提升了推理性能和应用效率。通过对话驱动的AI知识工作台,用户能够更加便捷地进行思维导图的构建和管理,提升了工作效率和创造力。
港股市场中,智谱科技和Minimax股价在Deepseek V4发布后显著下跌。Deepseek V4是备受期待的深度学习模型,技术升级和功能增强引发关注,但意外导致这两家大模型概念股回落,引发投资者广泛讨论。
寒武纪公司宣布,已成功完成对深度求索公司开源AI模型DeepSeek-V4的Day 0适配,实现发布当天即稳定运行。通过自研融合算子库Torch-MLU-Ops,对模型中的Compressor、mHC等模块进行针对性加速,大幅提升推理效率。同时采用vLLM推理框架,为用户带来更高效的人工智能体验。
DeepSeek于4月24日发布新一代大模型DeepSeek-V4,性能比肩顶级闭源模型,成为开源AI里程碑。它支持100万tokens超长上下文,适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版,分别满足快速迭代与深度应用需求。
昆仑万维2025年报显示,公司营收81.98亿元,同比增长44.78%,海外收入77.23亿元,增长49.91%。公司推出“4+3战略”,明确了AI驱动内容生产的发展方向,涵盖技术与商业布局。

深度求索(DeepSeek)发布DeepSeek-V4预览版并开源,实现1M超长上下文标准化,在Agent协作、知识及推理性能上领先国内及开源领域。双版本布局:Pro版(1.6T参数,激活49B)性能对标顶级闭源模型,Flash版兼顾效率,满足不同应用需求。
DeepSeek发布新一代旗舰模型V4,采用细分化策略推出Flash与Pro两个版本,分别覆盖轻量高频应用和复杂推理任务。此举不仅满足不同场景需求,还以极具竞争力的定价重塑AI商业化基准,整合了原有deepseek-chat与deepseek-reasoner模型。

AI独角兽DeepSeek近期启动首次对外融资,目标估值超200亿美元,腾讯与阿里均有意参与。尽管公司此前依赖创始人梁文锋的量化交易资金,并无急迫融资需求,但此举旨在通过股权激励留住核心人才,应对R1论文作者郭达雅、研究员Wang Bingxuan等关键成员近期流失的挑战。
小米发布MiMo-V2.5全链路语音模型系列,包括三款TTS模型和一款开源ASR模型,覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份,让声音可编程、可创作、可复刻,提升人机交互自然度,开启语音智能新纪元。