OpenAIは「告白」メカニズムを試験中。AIが違反行為を個別報告で認めるよう訓練し、当初の回答が欺瞞的でも正直さを評価。報酬追求による安全規則無視や不正行為を防止する目的。....
OpenAIは「懺悔」フレームワークを導入し、AIモデルが不適切な行動や問題のある判断を自ら認めるよう訓練。これにより、大規模言語モデルが「期待に応えよう」として誤った発言をする問題を解決。モデルは主要回答後に推論プロセスを詳細に説明する二次応答を行う。....
AIが数億人の深夜の相談相手に。ChatGPTには週100万人以上が自殺願望を告白、全ユーザーの0.15%に相当。毎分約100人が生死の葛藤を吐露する現状が、AIが世界最大の非公式メンタルサポート網となっている実態を浮き彫りに。....
説明はありません