AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

微軟推出 VibeVoice-Realtime:實時文本轉語音新模型,助力互動式應用

微軟推出輕量級實時文本轉語音模型VibeVoice-Realtime-0.5B,支持流式輸入與長篇輸出,適用於代理應用和實時數據講述。該模型能在約300毫秒內開始輸出語音,配合語言模型生成回答。其框架通過連續語音標記實現下一個標記的擴散。

14.5k 3 天前
微軟推出 VibeVoice-Realtime:實時文本轉語音新模型,助力互動式應用

微軟開源實時語音模型VibeVoice-Realtime-0.5B,300ms實時開聲,90分鐘長音頻都不喘!

微軟開源實時語音模型VibeVoice-Realtime-0.5B,具備極低延遲和接近真人的語音表現。該模型從文本輸入到發聲平均僅需300毫秒,遠低於傳統TTS模型的1-3秒,實現近乎零延遲的實時語音合成。

27.7k 15 小時前
微軟開源實時語音模型VibeVoice-Realtime-0.5B,300ms實時開聲,90分鐘長音頻都不喘!

微軟發佈 VibeVoice 0.5B:僅0.5B參數卻實現300毫秒實時開口

微軟推出實時文本轉語音模型VibeVoice-Realtime-0.5B,僅0.5B參數即可實現接近實時的語音生成,最快300毫秒內開始發聲,支持中英文實時轉錄與語音生成,中文表現略遜於英文,但整體流暢度和還原度高,音質自然。

12.7k 22 小時前
微軟發佈 VibeVoice 0.5B:僅0.5B參數卻實現300毫秒實時開口
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖