《纽约时报》报道称,谷歌AI概览功能准确率约90%。基于谷歌每年超5万亿次搜索量,这意味着每小时可能产生超5700万条错误答案,每分钟近百万条错误信息。初创公司Oumi评估显示,谷歌Gemini模型准确率从去年10月的85%提升至今年2月的91%。
谷歌搜索因AI概述功能频现事实错误和矛盾,面临质量信任危机。为应对此问题,谷歌紧急招聘AI答案质量工程师,专门优化生成式答案的准确性与可靠性。
OpenAI推出“忏悔”训练框架,旨在提升AI模型的诚实度。该机制要求模型在给出主要答案后,主动承认自身错误或不当行为,以纠正传统训练中可能导致的掩盖真相或提供不准确回答的问题。
谷歌推出数据公用MCP服务器,帮助AI代理快速访问公共数据集,减少信息错误并提供可验证答案。该工具简化数据使用流程,支持标准化消费方式,无需复杂操作即可返回可靠来源信息,加速数据驱动型应用的开发。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Baidu
32
Openai
$14
$56
200
Anthropic
$21
$105