寒武纪宣布完成对DeepSeek-V4全系列模型的“Day0”适配,基于vLLM推理框架,覆盖285B参数Flash版及1.6T参数Pro版。通过自研Torch-MLU-Ops算子库优化稀疏注意力与压缩结构,确保模型发布当日即可在寒武纪硬件上稳定运行,相关代码已开源至GitHub。
寒武纪公司宣布,已成功完成对深度求索公司开源AI模型DeepSeek-V4的Day 0适配,实现发布当天即稳定运行。通过自研融合算子库Torch-MLU-Ops,对模型中的Compressor、mHC等模块进行针对性加速,大幅提升推理效率。同时采用vLLM推理框架,为用户带来更高效的人工智能体验。
寒武纪董事长陈天石在2025年度业绩说明会上回应投资者,针对互联网大厂自研芯片的竞争压力,强调公司产品采用“通用型”设计,具备更强的普适性,能应对多样化AI技术。他指出,大厂芯片多围绕主营业务提供垂直解决方案,而寒武纪的通用架构更灵活,适应不同场景需求。
深度求索将于下周发布多模态大模型V4,原生支持图像、视频与文本生成,旨在填补国内高性能低成本开源多模态模型市场空白。这是继1月发布R1推理模型后的首次重大更新。发布初期将提供简要技术说明,一个月后公开详细工程报告。V4模型已与华为、寒武纪完成底层生态合作。
nyu-visionx
寒武纪是一个开源的以视觉为核心设计的 multimodal LLM(多模态大语言模型)。