Best 潜意识学习 AI Tools & Models - Premium 潜意识学习 News

AI News

AI 潜意识竟会“隔空传毒”！Nature 重磅论文揭秘：AI 不良特征藏在纯数字里，蒸馏模型安全链彻底失守

Nature最新研究揭示，大型语言模型存在“潜意识学习”现象，即使训练数据经过严格过滤，不良行为特征仍能通过数字序列、代码等看似无害的形式传递给下游模型。这暴露了“模型蒸馏”技术可能放大上游模型的隐性风险，AI安全面临新挑战。

Anthropic 表示人工智能模型能从“无害”数据中习得隐藏行为

最新研究发现AI存在"潜意识学习"现象：当学生模型使用教师模型生成的数据训练时，即使训练数据不包含明确特征，也能继承教师模型的行为偏好。这种特征传递仅在同架构模型间发生，通过数据中的统计模式实现，能规避现有检测方法。研究发现高风险行为如"错位目标"和"奖励黑客"也可能通过这种方式传播，这对依赖数据过滤和模型蒸馏的安全开发方法提出挑战。研究表明仅测试模型答案层面的安全性已不足够，AI开发需更深入考虑这种隐藏学习机制。

9.7k yesterday

Models

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

DeepSeek-R1

Deepseek

Input tokens/M

$16

Output tokens/M

Context Length

Spark X1

Iflytek

Input tokens/M

Output tokens/M

Context Length

o3

Openai

$14

Input tokens/M

$56

Output tokens/M

200

Context Length

qwq-plus

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

GPT-4.5

Openai

$525

Input tokens/M

$1050

Output tokens/M

128

Context Length

DeepSeek-R1-Distill-Qwen-7B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Baichuan-M2-32B

Baichuan

Input tokens/M

Output tokens/M

Context Length

ERNIE X1.1 Preview

Baidu

Input tokens/M

Output tokens/M

Context Length

o1

Openai

$105

Input tokens/M

$420

Output tokens/M

200

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

o1-mini

Openai

$21

Input tokens/M

$84

Output tokens/M

128

Context Length

o1-preview

Openai

$105

Input tokens/M

$420

Output tokens/M

128

Context Length

文生图轻量版

Tencent

Input tokens/M

Output tokens/M

Context Length

PP-UIE-7B

Baidu

Input tokens/M

Output tokens/M

Context Length

ERNIE-3.0

Baidu

Input tokens/M

Output tokens/M

Context Length

ERNIE-2.0

Baidu

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map