Best 自相矛盾指令 AI Tools & Models - Premium 自相矛盾指令 News

AI News

AI遇上"死亡挑战"：当机器人被要求把大象塞进冰箱

为了测试这些AI的"抗压能力"，一群研究者玩起了"大冒险"。他们搞了一个叫Self-Contradictory Instructions（SCI）的测试，简直就是AI界的"死亡挑战"。这个测试包含了20，000个自相矛盾的指令，涵盖了语言和视觉两大领域。比如，给你看一张猫咪照片，却让你描述这只"狗"。这不是为难人吗?哦不，是为难AI。

9.5k 2 days ago

Models

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

qwen-vl-max

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5

Openai

$8.75

Input tokens/M

$70

Output tokens/M

400

Context Length

Qwen3-235B-A22B-Instruct-2507

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-flash

Alibaba

$15

Input tokens/M

$15

Output tokens/M

Context Length

Spark X1

Iflytek

Input tokens/M

Output tokens/M

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Qwen3-235B-A22B

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_7b_Instruct

Alibaba

$0.5

Input tokens/M

Output tokens/M

128

Context Length

Gemma 3n E4B Instructed

Google

$140

Input tokens/M

$280

Output tokens/M

Context Length

qwen-plus

Alibaba

$0.8

Input tokens/M

$0.2

Output tokens/M

128

Context Length

Doubao-1.5-vision-lite

Bytedance

$1.5

Input tokens/M

$4.5

Output tokens/M

128

Context Length

Doubao-1.5-vision-pro-32k

Bytedance

Input tokens/M

Output tokens/M

Context Length

GPT-4o

Openai

$17.5

Input tokens/M

$70

Output tokens/M

128

Context Length

Qwen3-8B

Alibaba

$0.5

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Functioncall

Tencent

Input tokens/M

Output tokens/M

Context Length

GPT-4.1

Openai

$14

Input tokens/M

$56

Output tokens/M

Context Length

Qwen2-72B-Instruct

Alibaba

Input tokens/M

Output tokens/M

131

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map