AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

MOSS-Speech開源:國內首個語音到語音大模型,告別文本中介

復旦大學MOSS團隊發佈MOSS-Speech,首次實現端到端語音對話,模型已在Hugging Face上線並開源。採用“層拆分”架構,凍結原文本模型,新增語音理解、語義對齊和聲碼器層,可一次性完成語音問答、情緒模仿和笑聲生成,無需傳統三段式流程。評測顯示,在ZeroSpeech2025任務中詞錯率降至4.1%,情感識別準確率達91.2%。

13.1k 1 小時前
MOSS-Speech開源:國內首個語音到語音大模型,告別文本中介
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖