阿里雲通義團隊9月28日推出Qwen3Guard,這是Qwen家族首款安全護欄模型。基於Qwen3架構專項微調,旨在提升AI交互安全性,精準識別用戶輸入和AI回覆中的潛在風險,提供可靠防護。
Qwen
Qwen3-4B-SafeRL是基於Qwen3-4B模型的安全對齊版本,通過強化學習訓練並結合Qwen3Guard-Gen的獎勵信號,增強了模型對有害或對抗性提示的魯棒性,在保證安全性的同時避免產生過於簡單或迴避性的拒絕行為。