阿里通义实验室推出PrismAudio框架,解决AI视频生成中音画不同步问题。该技术引入“思维链”机制,先分析视频内容再生成匹配音效,提升沉浸感。研究已被ICLR2026收录。
阿里成立ATH事业群,由CEO亲自挂帅,整合通义实验室、MaaS、千问、AI创新及悟空事业部,旨在应对AI行业“模型过剩、场景饥渴”现状,从“卷参数”转向“卷应用”,发力下半场竞争。
阿里巴巴通义实验室与中国科学技术大学联合开源Fun-CineForge项目,针对影视配音中口型同步、音色迁移和情感表达等难题,提供端到端生产流水线和大模型解决方案,旨在解决传统AI配音口型不匹配、情感生硬及难以适应复杂场景的问题。
阿里巴巴成立Alibaba Token Hub事业群,由CEO吴泳铭挂帅,整合AI全栈布局,聚焦Token创造与应用,以应对AGI趋势。业务涵盖通义实验室、MaaS、千问事业部、AI创新事业部及新亮相的悟空事业部。
Wan是阿里巴巴通义实验室开发的先进视觉生成模型,可基于文本、图像等生成视频。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
$4
$16
1k
$1
$10
256
$6
$24
$2
$20
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
$0.8
128
$54
$163
Alibaba-NLP
基于ModernBERT预训练架构的英语文本重排序模型,由阿里巴巴通义实验室开发,支持8192 tokens长文本处理。
ali-vilab
阿里巴巴通义实验室开发的开源视频合成代码库,集成了多种先进的视频生成模型