最好的MOSS-Speech AI工具模型_精選MOSS-Speech資訊

AI資訊

MOSS-Speech開源：國內首個語音到語音大模型，告別文本中介

復旦大學MOSS團隊發佈MOSS-Speech，首次實現端到端語音對話，模型已在Hugging Face上線並開源。採用“層拆分”架構，凍結原文本模型，新增語音理解、語義對齊和聲碼器層，可一次性完成語音問答、情緒模仿和笑聲生成，無需傳統三段式流程。評測顯示，在ZeroSpeech2025任務中詞錯率降至4.1%，情感識別準確率達91.2%。

26.1k 昨天

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖