性能與效率的雙贏:Qwen3橫空出世,MoE架構大幅降低部署成本
阿里雲旗下通義千問(Qwen)團隊正式發佈Qwen3系列模型,共推出8款不同規格的模型,覆蓋從移動設備到大型服務器的全部應用場景。這是國內首個全面超越DeepSeek R1的開源模型,也是首個配備混合思維模式的國產模型。模型陣容豐富,滿足各類部署需求Qwen3系列包含6款Dense模型和2款MoE模型:Dense模型:0.6B、1.7B、4B、8B、14B、32BMoE模型:Qwen3-235B-A22B (總參數235B,激活參數22B)Qwen3-30B-A3B (總參數30B,激活參數3B)所有模型均支持128K上下文窗口,並配備了可手動控制的"thinking"開關,實現混合思維模