最好的MOSS-Speech AI工具模型_精选MOSS-Speech资讯

AI资讯

MOSS-Speech开源：国内首个语音到语音大模型，告别文本中介

复旦大学MOSS团队发布MOSS-Speech，首次实现端到端语音对话，模型已在Hugging Face上线并开源。采用“层拆分”架构，冻结原文本模型，新增语音理解、语义对齐和声码器层，可一次性完成语音问答、情绪模仿和笑声生成，无需传统三段式流程。评测显示，在ZeroSpeech2025任务中词错率降至4.1%，情感识别准确率达91.2%。

23.4k 4 小时前

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图