清華大學聯合多家機構開源MOSS-TTSD語音對話生成模型,基於Qwen3-1.7B-base訓練,支持中英雙語超長語音生成。創新採用XY-Tokenizer技術,實現1kbps低比特率下保留語音質量,具備零樣本音色克隆和聲音事件控制能力。在中文指標上優於MoonCast等開源模型,支持最長960秒語音生成,避免拼接不自然。已開放模型權重、API及在線Demo,適用於播客、有聲書等場景,未來將優化多說話人切換和情感表達。
malaysia-ai
基於Qwen/Qwen3-1.7B-Base進行繼續預訓練的多語言語音轉換和文本轉語音模型,支持多語言、多說話人的語音生成和轉換功能。
unsloth
Qwen3-1.7B-Base是通義千問系列最新一代大語言模型,提供高質量的預訓練語言模型能力。
Qwen3-1.7B-Base是通義系列最新一代大語言模型,提供了一系列密集模型和專家混合(MoE)模型,在訓練數據、模型架構和優化技術等方面進行了大量改進。
Qwen
Qwen3-1.7B是通義千問系列最新一代17億參數基礎語言模型,採用三階段預訓練體系,支持32k上下文長度。