Soul AI Lab 开源了首个14亿参数的实时数字人生成模型SoulXFlashTalk,具备亚秒级延迟和每秒32帧高帧率,提供完整实时交互解决方案。开源内容包括项目页面、技术报告、源代码和模型权重,全面开放,降低行业研发门槛。
豆包推出全自动AI多人有声剧系统,可直接从小说文本生成多人配音,角色识别准确率达98%,媲美专业广播剧效果。该方案为AI有声内容生产带来革新。
Soul推出SoulX-Podcast语音模型,专为播客设计,实现高真实度语音生成。支持长时段、多说话人、多语种交互,在自然对话模拟上取得突破。核心亮点是高保真与稳定性,能连续生成超90分钟内容无衰减,确保流畅自然。
mradermacher
SoulX-Podcast-1.7B 是一个基于 Soul-AILab/SoulX-Podcast-1.7B 的静态量化版本,专门用于文本转语音任务。该模型支持英语和中文,提供了多种量化版本以适应不同的硬件和性能需求。