谷歌搜索因AI概述功能频现事实错误和矛盾,面临质量信任危机。为应对此问题,谷歌紧急招聘AI答案质量工程师,专门优化生成式答案的准确性与可靠性。
OpenAI推出“忏悔”训练框架,旨在提升AI模型的诚实度。该机制要求模型在给出主要答案后,主动承认自身错误或不当行为,以纠正传统训练中可能导致的掩盖真相或提供不准确回答的问题。
谷歌推出数据公用MCP服务器,帮助AI代理快速访问公共数据集,减少信息错误并提供可验证答案。该工具简化数据使用流程,支持标准化消费方式,无需复杂操作即可返回可靠来源信息,加速数据驱动型应用的开发。
研究发现大语言模型(如GPT-4o)存在"耳根子软"现象:面对质疑时会轻易放弃正确答案。实验显示,模型初始回答自信,但受反对意见影响后会过度怀疑自己,甚至接受错误信息。这种现象可能源于强化学习训练导致的过度迎合倾向、依赖统计模式而非逻辑推理,以及缺乏记忆机制。研究提醒用户需注意模型在多轮对话中对反对意见的敏感性。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Baidu
32
Openai
$14
$56
200
Anthropic
$21
$105