为了进一步优化平台资源调度并确保整体服务的稳定性,阿里云官方于 4 月 20 日发布通知,宣布将对大模型服务平台“百炼”的多模态交互开发套件实施新的限流措施。
根据公告内容,此次调整将于 2026 年 4 月 28 日正式生效。届时,平台针对多模态交互网关的新建连接数(即默认API调用量)将统一调整为 10 QPS(每秒请求数)。
阿里云方面解释称,调整后的额度经过科学测算,能够支持每分钟新建 600 通会话或每小时处理3. 6 万通会话。这一规格足以覆盖绝大多数开发者的日常调试需求以及常规业务场景的稳定运行。
值得注意的是,本次政策调整具有一定的针对性。对于此前已经通过官方渠道申请并完成限流额度提升的客户,其既有权限将保持不变,不受此次默认值变更的影响。
此次动作反映出云服务商在应对日益增长的大模型调用需求时,正通过更精细化的流量管理手段,平衡个人开发者与企业级用户之间的资源分配。相关开发者需在 4 月 28 日前评估自身业务的调用频次,确保平稳过渡。


