清華大学がMOSS-TTSD音声対話生成モデルをオープンソース化。Qwen3-1.7B-baseで訓練、中英両対応の長音声生成可能。XY-Tokenizer技術で1kbps低ビットレートでも高音質を実現。音色クローンや音声制御機能を備え、MoonCastを上回る性能。960秒までの自然な音声生成が可能。APIやデモも公開、ポッドキャスト等に適用。今後は話者切り替えや感情表現の改善予定。....
malaysia-ai
Qwen/Qwen3-1.7B-Baseをベースに継続事前学習を行った多言語音声変換とテキスト読み上げモデルで、多言語、複数話者の音声生成と変換機能をサポートします。
unsloth
Qwen3-1.7B-Baseは通義千問シリーズの最新世代大規模言語モデルで、高品質な事前学習言語モデル能力を提供します。
Qwen3-1.7B-Baseは通義シリーズの最新世代の大規模言語モデルで、一連の密集モデルとエキスパート混合(MoE)モデルを提供し、学習データ、モデルアーキテクチャ、最適化技術などの面で多くの改善が行われています。
Qwen
Qwen3-1.7Bは通義千問シリーズ最新世代の17億パラメータ基本言語モデルで、3段階事前学習体系を採用し、32kのコンテキスト長をサポートします。