最好的VibeVoice-Realtime-0.5B AI工具模型_精选VibeVoice-Realtime-0.5B资讯 - AIBase

AI资讯

微软推出 VibeVoice-Realtime：实时文本转语音新模型，助力互动式应用

微软推出轻量级实时文本转语音模型VibeVoice-Realtime-0.5B，支持流式输入与长篇输出，适用于代理应用和实时数据讲述。该模型能在约300毫秒内开始输出语音，配合语言模型生成回答。其框架通过连续语音标记实现下一个标记的扩散。

微软推出 VibeVoice-Realtime：实时文本转语音新模型，助力互动式应用

微软开源实时语音模型VibeVoice-Realtime-0.5B，300ms实时开声，90分钟长音频都不喘！

微软开源实时语音模型VibeVoice-Realtime-0.5B，具备极低延迟和接近真人的语音表现。该模型从文本输入到发声平均仅需300毫秒，远低于传统TTS模型的1-3秒，实现近乎零延迟的实时语音合成。

27.7k 11 小时前

微软开源实时语音模型VibeVoice-Realtime-0.5B，300ms实时开声，90分钟长音频都不喘！

微软发布 VibeVoice 0.5B：仅0.5B参数却实现300毫秒实时开口

微软推出实时文本转语音模型VibeVoice-Realtime-0.5B，仅0.5B参数即可实现接近实时的语音生成，最快300毫秒内开始发声，支持中英文实时转录与语音生成，中文表现略逊于英文，但整体流畅度和还原度高，音质自然。

12.7k 18 小时前

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图