AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

AI “狼人殺” 大戰!GPT-4.5 封神:社交推理 + 頂級欺騙,把 Claude 和 DeepSeek 都 “玩弄於股掌”!

萬萬沒想到,AI 不僅能在棋盤上 “廝殺”,在 “狼人殺” 這種爾虞我詐的社交遊戲中,也展現出了驚人的智力! 最近,一場代號爲 “Elimination Game” 的 AI “狼人殺” 基準測試火爆出爐, 結果簡直讓人 “虎軀一震”: GPT-4.5竟然在這場 “社交博弈” 中 “封神”, 把 Claude3.7Sonnet 和 DeepSeek R1等一衆 AI “大佬” 都遠遠甩在了身後! 這不禁讓人驚呼: AI 的 “社交智能” 已經進化到如此恐怖的程度了嗎?這場 “Elimination Game” 的規則聽起來就 “心跳加速”: 最多8名玩家(可以是 AI 模型,也可以

24.9k 前天
AI “狼人殺” 大戰!GPT-4.5 封神:社交推理 + 頂級欺騙,把 Claude 和 DeepSeek 都 “玩弄於股掌”!

AI產品

查看更多
Elimination Game

Elimination Game

一種測試大語言模型在複雜社交博弈中智能性的基準測試框架,靈感來源於‘狼人殺’遊戲。

AI模型
10k
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖