DeepSeek 开启识图模式灰度测试，多模态视觉理解能力正式落地

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Apr 30, 2026

在 DeepSeek-V4发布并引发行业震动仅五天后，DeepSeek 官方正式开启多模态识图功能的灰度测试，标志着其多模态能力进入实质性落地阶段。此次更新在移动端与网页版输入栏中新增了“识图模式”入口，并显著标注“图片理解功能内测中”，完成了从纯文本/代码向视觉交互的重要跨越。

实测数据显示，DeepSeek 在基础视觉理解与画面描述方面表现优异。在识别复杂人物、环境构图及摄影细节时，能产出极高还原度的描述文本;在开启“思考模式”后，模型展现了深度的逻辑推理能力，可根据文物视觉特征准确推导其艺术风格与历史背景。此外，其对图片中文字信息的提取与场景判断亦达到了行业主流水准。

然而，在面对极端视觉挑战时，该模块仍存在优化空间。测试表明，模型在处理碎块化、反色等抗干扰图像时识别率受限;在元素计数与复杂图形逻辑推理任务中，虽然展现了自博弈式的推理尝试，但在准确率与响应效率上仍有提升余地。此外，其对极新产品信息的覆盖仍受限于现有知识库的更新周期。

行业分析指出，该功能目前更接近于挂载在主干模型上的视觉理解模块，旨在通过灰度测试验证多模态链路。随着 DeepSeek 视觉补丁的快速迭代，国产大模型在原生多模态赛道的竞争重心正从“参数规模”向“全场景感知”转型。此次内测不仅补齐了 DeepSeek 的核心功能短板，也预示着其原生多模态大招已进入最后筹备期。

DeepSeek-V4 多模态识图 AI新词视觉交互

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元，支持手机反向充电

钉钉发布AI硬件新品DingTalk A1Pro，定价1299元，定位专业AI录音卡片，专为高频出差商务人士设计。该设备厚度仅6.4mm，支持磁吸与触控屏，搭载专业级MEMS指向性麦克风，具备“AI办公+应急补能”复合功能，拓展钉钉软硬一体化服务边界。

2026年4月30号 17:59

370

押注于人而非代码：Zig 项目全面禁止 LLM 辅助贡献引发热议

生成式AI席卷编程领域之际，Zig开源项目逆势推出严格政策：全面禁止使用大语言模型生成的代码或评论参与贡献。知名开发者Simon Willison解读后，引发社区对技术效率与人才培养博弈的讨论。核心矛盾在于代码产出与人才成长的取舍，Zig维护者重新定义“贡献”，强调原创与学习过程。

2026年4月30号 17:24

快手推出 KroWork:AI 桌面助手助你高效办公

快手推出AI桌面智能体KroWork，面向非技术用户，支持自然语言指令完成文件处理、浏览器自动化及应用生成等办公任务。用户可将重复工作转化为本地应用，无需额外付费。所有操作在安全沙箱环境中执行，数据不上传云端，保障隐私安全。

2026年4月30号 17:17

430

AI日报：DeepSeek识图模式灰测；小红书成立AI一级部门；阿里发布程序员“数字分身”QoderWake

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、DeepSeek开启识图模式灰度测试，多模态视觉理解能力正式落地DeepSeek在发布DeepSeek-V4后迅速开启多模态识图功能的灰度测试，标志着其多模态能力进入实质性阶段。Gemini迎来史诗级更新，一键生成Office文档Gemini通过新增直接生成和导出多种格式文件的功能，显著提升了其作为生产力工具的能力，同时增强了与办公软件的衔接性，为用户提供了更高效的办公体验。

2026年4月30号 16:27