AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

AI音頻新技術MMAudio:輸入視頻或文本可自動給視頻配音效

近日,來自伊利諾伊大學厄巴納 - 香檳分校、Sony AI 及 Sony 集團公司的研究團隊推出了一項名爲 MMAudio 的新技術,該技術旨在通過多模態聯合訓練,實現高質量的視頻到音頻合成。MMAudio 的核心創新在於能夠利用視頻和文本輸入生成同步的音頻,從而拓展了音頻生成的應用場景,支持輸入視頻或文本,生成符合視頻內容的音效。MMAudio 的設計使其能夠在各種視聽和音頻文本數據集上進行訓練。這種多模態聯合訓練的方式,不僅提高了合成音頻的質量,還確保了生成的音頻與視頻幀之間的同步

33.3k 4 天前
AI音頻新技術MMAudio:輸入視頻或文本可自動給視頻配音效

AI產品

查看更多
ComfyUI-MMAudio

ComfyUI-MMAudio

ComfyUI節點,用於MMAudio模型的音頻處理

音頻生成
11.1k
MMAudio

MMAudio

MMAudio根據視頻和/或文本輸入生成同步音頻。

視頻生成
10.4k
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖