AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

阿里通义万相团队推出Wan 2.2-S2V模型,实现视频与音频同步生成,提升AI视频制作效率。该模型已在社交媒体平台X上发布,为开发者提供创新AI应用工具。

27.1k 4 天前
AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

微软开源 VibeVoice-1.5B 模型:90 分钟超长语音合成新突破

微软开源VibeVoice-1.5B音频模型,实现语音合成技术突破。该模型可一次性合成90分钟超长语音,远超此前60分钟限制,有效解决音色漂移和语义断裂问题。支持最多四位发言人,合成语音更自然、效果更优。

11.2k 5 天前
微软开源 VibeVoice-1.5B 模型:90 分钟超长语音合成新突破

模型

查看更多

Vibevoice Gguf

gguf-org

V

vibevoice-gguf 是一个基于 Microsoft VibeVoice-1.5B 模型的文本转语音系统,通过 gguf-connector 运行,能够将文本转换为自然语音,支持语音克隆和多说话人语音生成。

音频处理GgufGguf
gguf-org
2.4k
17
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图