阿里雲通義チームが9月28日にQwen3Guardを発表。Qwenファミリー初のセキュリティモデルで、AIインタラクションの安全性向上を目的とし、潜在リスクを正確に識別。....
Qwen
Qwen3-4B-SafeRLはQwen3-4Bモデルをベースにしたセキュリティアライメント版で、強化学習による訓練とQwen3Guard-Genの報酬信号を組み合わせることで、有害または敵対的なプロンプトに対するモデルのロバスト性を強化し、セキュリティを保ちながら、過度に簡単な拒否行動や回避的な拒否行動を避けています。