AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
数据集市
AI应用指南
ZH

AI资讯

查看更多

通义推出CoGenAV多模态语音表征模型 可实现音画同步感知

​近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。 传统语音识别在噪声环境下表现欠佳,CoGenAV则另辟蹊径,通过学习audio-visual-text之间的时序对齐关系,构建出更鲁棒、更通用的语音表征框架,系统性提升语音识别任务(VSR/AVSR)、语音重建任务(AVSS/AVSE)以及语音同步任务(ASD)等多个Speech-Centric任务的表现力。

14k 24 分钟前
通义推出CoGenAV多模态语音表征模型 可实现音画同步感知
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图