剑桥大学研究揭示AI真实水平:所有大模型都是“草台班子”!
最近,剑桥大学等团队发表了一篇重磅论文,揭示了大模型(LLM)们的真实面目,深入剖析了当前大语言模型(LLM)的实际表现,结果令人震惊 —— 这些被寄予厚望的AI模型,在很多基本任务上的表现远不如人们想象的那样出色。这项研究对包括o1-preview在内的多个前沿模型进行了全面评测。结果显示,AI模型与人类在理解能力上存在显著差异。令人意外的是,模型在人类认为复杂的任务上表现出色,却在简单问题上频频失误。这种反差让人不禁怀疑,这些AI是否真的理解了任务本质,还是仅