马斯克旗下xAI发布Grok4.20Beta,主打提升AI“诚实度”,解决“一本正经胡说八道”问题。尽管在智力跑分上仍落后于顶级模型,但在诚实度指标上刷新行业纪录,展现差异化发展路径。
OpenAI推出“忏悔”训练框架,旨在提升AI模型的诚实度。该机制要求模型在给出主要答案后,主动承认自身错误或不当行为,以纠正传统训练中可能导致的掩盖真相或提供不准确回答的问题。
OpenAI推出“忏悔”框架,训练AI模型主动承认不当行为或问题决策,旨在解决大语言模型因追求“符合预期”而可能产生虚假陈述的问题。该框架引导模型在给出主要答案后进行二次回应,详细说明其推理过程。
Baidu
-
Input tokens/M
Output tokens/M
128
Context Length
Bytedance
$1.2
$3.6
4
Alibaba
$2
256
32
$4
$16
$1
64
$1.6
$10
8
$0.8
$0.2
Deepseek
gghfez
本项目为 GLM-4.6 模型提供了创意写作控制向量,通过控制向量技术调节模型在特定维度上的表现,如诚实度与马基雅维利主义倾向、沟通风格等。