字节跳动联合港科大发布MMProLong：长文档LMM训练问答对效率远超OCR转录

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · May 25, 2026

5月24日，字节跳动Seed团队联合香港科技大学发布了一项针对多模态大语言模型（LMM）长文档训练的最新研究成果。研究人员基于阿里巴巴开源的Qwen2.5-VL构建了名为 MMProLong 的新模型，并在长文档处理效率上取得突破性进展。该研究不仅打破了多模态模型长文本训练的传统路径，更揭示了数据组织形式对模型长上下文能力的关键影响。

这项研究的核心发现直击当前LMM训练的痛点:在多模态长文档训练中，针对特定目标进行问答对（QA）训练的效果显著优于传统的字符识别（OCR）转录。实验表明，纯文本转录作为训练任务非但无法提升模型在长上下文中的定位能力，反而会导致性能下降;而通过独立模型（如字节跳动Seed2.0）生成的长上下文问答对进行训练，则能引导模型在冗长干扰信息中精准检索目标段落。

基于这一优化策略，MMProLong 在仅 128，000个Token 的有限训练预算下，展现出极强的长文本稳定性，在输入长度达到 256，000乃至512，000个Token 时依然没有出现性能崩溃，并在 MMLongBench 和 MM-NIAH（大海捞针）基准测试中大幅超越 InternVL3-38B 和Gemma3-27B等体量更大的开源模型。此外，MMProLong 的多模态能力还成功迁移至未经专门训练的长视频理解任务中，并在Qwen3-VL-8B模型上同样验证了该策略 water-proof 的有效性。

此项研究为当前大模型行业提供了一条不同于 DeepSeek（通过视觉信息高度压缩与重新排序升级架构）的演进路线，证明了通过优化训练数据结构而非改动底层架构，同样能实现长上下文能力的跨越式提升，为未来更长模态、多步骤智能体的开发开辟了更为经济、高效的技术可行性。

面壁智能联合清华大学发布中国首个1.58-bit大模型BitCPM-CANN

面壁智能联合清华大学及OpenBMB开源社区，发布并开源了中国首个基于华为昇腾平台训练的三值（1.58-bit）大模型BitCPM-CANN。该模型在低比特训练领域取得突破，实现从量化算子到训练算法的全链路原生开发，推出0.5B至8B四个尺寸版本，展示了国产算力平台的强大实力。

一季度全球AI领域融资超1100亿元，国产大模型5月再获超300亿注资

近期人工智能创投市场持续升温。一季度全球AI领域发生近600起融资，总额超1100亿元，同比增长185.4%。5月国内势头强劲，月之暗面、阶跃星辰等大模型企业获超300亿元融资；具身智能赛道也受追捧，维他动力、鹿明机器人等初创公司一周内获数亿元融资。资金快速涌入，市场热度不减。

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

清华大学存储实验室与腾讯混元AI Infra团队在MLSys2026 MoE模型推理优化挑战赛中获全球冠军。针对万亿参数混合专家（MoE）架构在异构NPU上的推理瓶颈，联合团队设计了全链路优化方案，包括E-Shard策略、PSUM三维张量批量读出及GEMV路径，显著提升性能。

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

GEO 品牌全景分析

GEO 品牌得分检测

GEO 排名查询

AI 对话问题挖掘

GEO 推广链接检测

GEO排名优化系统源码

GEO 排名优化服务

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

大模型API聚合平台

模型库

模型供应商

大模型排行榜

大模型选型对比

大模型费用计算器

大模型竞技场

模型个人电脑配置检测器

模型部署服务器配置计算器

字节跳动联合港科大发布MMProLong：长文档LMM训练问答对效率远超OCR转录

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

xAI 祭出“杀手锏”：1.5 万亿参数 Grok V9-Medium 训练完成，直指编程 AI 赛道

面壁智能联合清华大学发布中国首个1.58-bit大模型BitCPM-CANN

单季吸金超千亿，AI创投潮涌掀起技术迭代新风暴

中国大模型调用量连续 4 周碾压美国：全球 AI 开发者正加速“国产化”

网络快餐还是精神断粮？AI生成文章已全面碾压人类创作

一季度全球AI领域融资超1100亿元，国产大模型5月再获超300亿注资

阿里千问发布新一代大模型Qwen3.7-Max

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

微软新推 Fara1.5 系列智能体模型，任务成功率高达 72%！超越 OpenAI！

​一季度 AI 投资火爆！国产大模型融资额暴增至 300 亿元！

相关AI新闻推荐

xAI 祭出“杀手锏”：1.5 万亿参数 Grok V9-Medium 训练完成，直指编程 AI 赛道

面壁智能联合清华大学发布中国首个1.58-bit大模型BitCPM-CANN

单季吸金超千亿，AI创投潮涌掀起技术迭代新风暴

中国大模型调用量连续 4 周碾压美国：全球 AI 开发者正加速“国产化”

网络快餐还是精神断粮？AI生成文章已全面碾压人类创作

一季度全球AI领域融资超1100亿元，国产大模型5月再获超300亿注资

阿里千问发布新一代大模型Qwen3.7-Max

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

微软新推 Fara1.5 系列智能体模型，任务成功率高达 72%！超越 OpenAI！

​一季度 AI 投资火爆！国产大模型融资额暴增至 300 亿元！

一季度 AI 投资火爆！国产大模型融资额暴增至 300 亿元！

一季度 AI 投资火爆！国产大模型融资额暴增至 300 亿元！