AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
數據集市
AI應用指南
TW

AI資訊

查看更多

通義推出CoGenAV多模態語音表徵模型 可實現音畫同步感知

​近日,通義大模型發佈CoGenAV,以音畫同步理念創新語音識別技術,有效解決語音識別中噪聲干擾的難題。 傳統語音識別在噪聲環境下表現欠佳,CoGenAV則另闢蹊徑,通過學習audio-visual-text之間的時序對齊關係,構建出更魯棒、更通用的語音表徵框架,系統性提升語音識別任務(VSR/AVSR)、語音重建任務(AVSS/AVSE)以及語音同步任務(ASD)等多個Speech-Centric任務的表現力。

14k 2 小時前
通義推出CoGenAV多模態語音表徵模型 可實現音畫同步感知
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖