阿里通義千問團隊開源Qwen3-TTS系列語音生成模型,採用端到端架構,支持秒級音色克隆、自然語言音色設計和實時流式輸出。其核心創新Dual-Track雙軌混合流式生成機制結合離散多碼本語言模型,實現極致低延遲,大幅降低實時應用門檻。