AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

微軟開源實時語音模型VibeVoice-Realtime-0.5B,300ms實時開聲,90分鐘長音頻都不喘!

微軟開源實時語音模型VibeVoice-Realtime-0.5B,具備極低延遲和接近真人的語音表現。該模型從文本輸入到發聲平均僅需300毫秒,遠低於傳統TTS模型的1-3秒,實現近乎零延遲的實時語音合成。

8.8k 剛剛
微軟開源實時語音模型VibeVoice-Realtime-0.5B,300ms實時開聲,90分鐘長音頻都不喘!

微軟發佈 VibeVoice 0.5B:僅0.5B參數卻實現300毫秒實時開口

微軟推出實時文本轉語音模型VibeVoice-Realtime-0.5B,僅0.5B參數即可實現接近實時的語音生成,最快300毫秒內開始發聲,支持中英文實時轉錄與語音生成,中文表現略遜於英文,但整體流暢度和還原度高,音質自然。

8.2k 1 小時前
微軟發佈 VibeVoice 0.5B:僅0.5B參數卻實現300毫秒實時開口
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖