阿里巴巴通义实验室发布MAI-UI多模态GUI智能代理家族,整合人机交互、工具使用与云端协作,在通用及移动GUI导航方面表现领先,超越多个同行模型。该系统基于Qwen3VL构建,提供多种规模模型,支持自然语言指令处理。
阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,扩展Z-Image系列图像生成生态。该模型强化了精确控制与创意生成能力,已在Hugging Face上线,采用Apache2.0许可,支持商用。
阿里巴巴开源Z-Image图像模型,支持中英双语文字渲染,仅6B参数实现高效图像生成与编辑,视觉质量优秀。该模型由通义实验室开发,聚焦AI技术趋势,助力开发者洞悉创新应用。
阿里巴巴旗下夸克正秘密推进" C计划",由核心团队与通义实验室高级成员主导,聚焦对话式AI应用布局。首个阶段性成果预计近期落地,显示阿里持续投入AI领域,强调长期技术突破。
Wan是阿里巴巴通义实验室开发的先进视觉生成模型,可基于文本、图像等生成视频。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
$4
$16
1k
$1
$10
256
$2
$20
$6
$24
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
$0.8
128
$54
$163
Alibaba-NLP
基于ModernBERT预训练架构的英语文本重排序模型,由阿里巴巴通义实验室开发,支持8192 tokens长文本处理。
ali-vilab
阿里巴巴通义实验室开发的开源视频合成代码库,集成了多种先进的视频生成模型