阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jan 27, 2025

964

继 DeepSeek R1之后，阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M，再次引发业界关注。

此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。这是通义千问首次推出能够原生支持百万Token上下文长度的模型，并在推理速度上实现了显著提升。

阿里云、通义千问

Qwen2.5-1M 的核心亮点在于其原生支持百万 Token 的超长上下文处理能力。这使得模型能够轻松应对书籍、长篇报告、法律文件等超长文档，无需进行繁琐的分割处理。同时，该模型还支持更长时间、更深入的对话，能够记住更长的对话历史，实现更连贯、更自然的交互体验。此外，Qwen2.5-1M 在理解复杂任务，如代码理解、复杂推理、多轮对话等方面也展现出更强大的能力。

除了令人震撼的百万Token上下文长度，Qwen2.5-1M 还带来了另一项重大突破:闪电般快速的推理框架!通义千问团队完全开源了基于 vLLM 的推理框架，并集成了稀疏注意力机制。这一创新性的框架使得 Qwen2.5-1M 在处理百万 Token 输入时，速度提升了 3倍到7倍!这意味着用户可以更加高效地使用超长上下文模型，极大地提升了实际应用场景的效率和体验。

DeepSeekR1 阿里云 Qwen2.5-1M 开源模型

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

小米大模型 MiMo 公测延长，用户可免费体验至 2026 年！

小米宣布将自研大模型MiMo-V2-Flash的公测限免期延长20天，至2026年1月20日。该模型参数量达3090亿，激活参数150亿，在推理和代码生成方面表现优异。此举旨在为用户提供更长的体验时间，并展现小米在AI领域的持续投入与信心。

2025年12月31号 17:46

400

MiniMax重磅推出M2.1编程模型，AI开发新纪元即将开启！

MiniMax开源M2.1编程模型，已在Hugging Face、ModelScope和GitHub上线，方便开发者接入。该模型获vLLM“Day-0”支持，可立即实现高效推理，并通过KTransformers技术优化性能。

2025年12月31号 16:58

390

苏州乐享发布具身智能品牌“元点智能”，全尺寸机器人原型首度亮相

乐享科技发布全新具身智能品牌“元点智能”，并推出首款全尺寸人形机器人原型，正式进军通用机器人领域。品牌已构建覆盖户外、家庭等场景的产品矩阵，包括履带式户外机器人W1等，致力于打造全场景智能机器人解决方案。

2025年12月31号 16:40

220

AI日报：腾讯开源3D动作神器混元Motion1.0；罗永浩发布AI讲书App“且听”；夸克AI眼镜首次OTA

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、腾讯炸场！8、智能眼镜、手环也能享以旧换新补贴!2026年“两新”政策新增AI产品支持2026年“两新”政策迎来重要升级，首次将智能眼镜和智能家居产品纳入以旧换新补贴范围，进一步降低智能设备的购买门槛，推动AI终端在健康监测、远程协作等场景的规模化落地。

2025年12月31号 16:23

320