AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

騰訊出品!AI音頻模型 EzAudio AI,讓文本秒變逼真聲音

近日,約翰霍普金斯大學與騰訊 AI 實驗室聯合推出了一款名爲 EzAudio 的新型文本到音頻生成模型。這項技術承諾以空前的效率和高品質文本轉換爲聲音,標誌着人工智能和音頻技術的重大飛躍。EzAudio 的工作原理是利用音頻波形的潛在空間,而不是傳統的聲譜圖,這一創新讓它能夠在高時間分辨率下工作,且無需額外的神經聲碼器。EzAudio 的架構被稱爲 EzAudio-DiT(擴散變換器),採用了多項技術創新來提高性能和效率。其中包括一種新的自適應層歸一化技術 AdaLN-SOLA、長跳連接,以及先進的

28.4k 12-17
騰訊出品!AI音頻模型 EzAudio AI,讓文本秒變逼真聲音

AI產品

查看更多
EzAudio

EzAudio

高效生成高質量文本到音頻模型

AI文本轉語音
8.8k
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖