AI “狼人殺” 大戰!GPT-4.5 封神:社交推理 + 頂級欺騙,把 Claude 和 DeepSeek 都 “玩弄於股掌”!
萬萬沒想到,AI 不僅能在棋盤上 “廝殺”,在 “狼人殺” 這種爾虞我詐的社交遊戲中,也展現出了驚人的智力! 最近,一場代號爲 “Elimination Game” 的 AI “狼人殺” 基準測試火爆出爐, 結果簡直讓人 “虎軀一震”: GPT-4.5竟然在這場 “社交博弈” 中 “封神”, 把 Claude3.7Sonnet 和 DeepSeek R1等一衆 AI “大佬” 都遠遠甩在了身後! 這不禁讓人驚呼: AI 的 “社交智能” 已經進化到如此恐怖的程度了嗎?這場 “Elimination Game” 的規則聽起來就 “心跳加速”: 最多8名玩家(可以是 AI 模型,也可以