Google DeepMindがSCoReを発表:大規模言語モデルの自己修正を実現する新技術
Google DeepMindの研究チームは最近、SCoRe(Self-Correction through Reinforcement Learning:強化学習による自己修正)と呼ばれる革新的な技術を開発し、大きな進歩を遂げました。この技術は、大規模言語モデル(LLM)が抱える長年の課題である自己修正の困難さを解決することを目指しており、複数のモデルや外部チェックに頼ることなく、エラーの特定と修正が可能です。SCoRe技術の中核は、その2段階アプローチにあります。第一段階では、モ