Best 诚实度 AI Tools & Models - Premium 诚实度 News

AI News

不卷性能卷“人品”：xAI 发布 Grok 4.20，幻觉率创行业新低

马斯克旗下xAI发布Grok4.20Beta，主打提升AI“诚实度”，解决“一本正经胡说八道”问题。尽管在智力跑分上仍落后于顶级模型，但在诚实度指标上刷新行业纪录，展现差异化发展路径。

18.1k 10 hours ago

OpenAI 推出 “忏悔” 框架：让 AI 更诚实，敢于认错！

OpenAI推出“忏悔”训练框架，旨在提升AI模型的诚实度。该机制要求模型在给出主要答案后，主动承认自身错误或不当行为，以纠正传统训练中可能导致的掩盖真相或提供不准确回答的问题。

11.9k 4 days ago

OpenAI 推出 AI “忏悔”框架:旨在训练模型承认不当行为，提高诚实度

OpenAI推出“忏悔”框架，训练AI模型主动承认不当行为或问题决策，旨在解决大语言模型因追求“符合预期”而可能产生虚假陈述的问题。该框架引导模型在给出主要答案后进行二次回应，详细说明其推理过程。

13.5k yesterday

Models

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

百度蒸汽机2.0音视一体

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-ToyTalk

Baidu

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-pro

Bytedance

Input tokens/M

$16

Output tokens/M

128

Context Length

ERNIE X1 Turbo

Baidu

Input tokens/M

Output tokens/M

Context Length

qwen-tts

Alibaba

$1.6

Input tokens/M

$10

Output tokens/M

Context Length

qwen-plus

Alibaba

$0.8

Input tokens/M

$0.2

Output tokens/M

128

Context Length

QianfanHuijin-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

QianfanHuijin-Reason-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-QI-VL

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-PublicOpinion-Classification

Baidu

Input tokens/M

Output tokens/M

Context Length

QianfanHuijin-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

QianfanHuijin-Reason-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-Llama-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-14B

Deepseek

Input tokens/M

Output tokens/M

Context Length

ERNIE X1.1 Preview

Baidu

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​不卷性能卷“人品”：xAI 发布 Grok 4.20，幻觉率创行业新低

OpenAI 推出 “忏悔” 框架：让 AI 更诚实，敢于认错！

OpenAI 推出 AI “忏悔”框架:旨在训练模型承认不当行为，提高诚实度

Models

Qianfan-Lightning

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Qianfan-VL-8B

Qianfan-VL-70B

百度蒸汽机2.0音视一体

Qianfan-ToyTalk

Doubao-1.5-thinking-pro

ERNIE X1 Turbo

qwen-tts

qwen-plus

QianfanHuijin-8B

QianfanHuijin-Reason-8B

Qianfan-QI-VL

Qianfan-PublicOpinion-Classification

QianfanHuijin-70B

QianfanHuijin-Reason-70B

Qianfan-Llama-VL-8B

DeepSeek-R1-Distill-Qwen-14B

ERNIE X1.1 Preview

GLM 4.6 Control Vectors

不卷性能卷“人品”：xAI 发布 Grok 4.20，幻觉率创行业新低