AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

微软开源实时语音模型VibeVoice-Realtime-0.5B,300ms实时开声,90分钟长音频都不喘!

微软开源实时语音模型VibeVoice-Realtime-0.5B,具备极低延迟和接近真人的语音表现。该模型从文本输入到发声平均仅需300毫秒,远低于传统TTS模型的1-3秒,实现近乎零延迟的实时语音合成。

9.5k 16 分钟前
微软开源实时语音模型VibeVoice-Realtime-0.5B,300ms实时开声,90分钟长音频都不喘!

微软发布 VibeVoice 0.5B:仅0.5B参数却实现300毫秒实时开口

微软推出实时文本转语音模型VibeVoice-Realtime-0.5B,仅0.5B参数即可实现接近实时的语音生成,最快300毫秒内开始发声,支持中英文实时转录与语音生成,中文表现略逊于英文,但整体流畅度和还原度高,音质自然。

8.2k 36 分钟前
微软发布 VibeVoice 0.5B:仅0.5B参数却实现300毫秒实时开口
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图