AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

ControlMM:文字、语音、音乐多模态输入生成全身动作

ControlMM是香港中文大学与腾讯联合开发的创新技术框架,旨在解决多模态全身动作生成中的难题。该框架支持文本、语音、音乐等多模态输入,生成与内容匹配的全身动作,通过ControlMM-Attn模块并行处理动态与静态人体拓扑,实现高效运动知识学习。采用分阶段训练策略,从文本到运动预训练到多模态控制适应,确保模型在不同条件下的有效性。ControlMM-Bench基准引入,提供统一格式的多模态全身动作生成评估,推动了领域发展。实验结果表明,ControlMM在可控性、顺序性和运动合理性方面显著优于基线模型,展现了在文本、语音和音乐控制下的出色性能。

14.9k 9 小时前
ControlMM:文字、语音、音乐多模态输入生成全身动作

AI产品

查看更多
ControlMM

ControlMM

全身运动生成框架,支持多模态控制

AI模型
11.9k
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图