推論性能が飛躍的に向上!DeepSeekが革新的技術SPCTを発表、大規模モデルがより人間を理解
中国の注目を集める人工知能研究機関DeepSeek AIは、強力なオープンソース言語モデルDeepSeek-R1に続き、大規模言語モデル(LLM)分野で再び大きな進歩を遂げました。最近、DeepSeek AIは、より汎用的で拡張性の高いAI報酬モデル(Reward Models)を構築することを目的とした、自己主導原則の批判的調整(Self-Principled Critique Tuning、略してSPCT)という革新的な技術を発表しました。