最近,北京大学物理学院联合多个院系,推出了一项名为 “PHYBench” 的全新评测基准,旨在检验大模型在物理推理上的真实能力。该项目由朱华星老师和曹庆宏副院长主导,汇聚了来自物理学院和其他学科的200多名学生,其中不少人曾在全国中学生物理竞赛中获金牌。PHYBench 设计了500道精心制作的高质量物理题,这些题目涵盖高中物理、大学物理及物理奥林匹克竞赛的各个层面。与传统评测基准不同,PHYBench 不仅考察模型的答案是否正确,更引入了一种创新的评分方式 —— 表达式树编辑
["FBI专家警告,青少年正在利用人工智能技术生成深度伪造裸照,对同学进行恶意攻击,令家庭感到尴尬和害怕。","这一技术不再仅限于名人和社交影响者,而是被中学生和青少年用来欺凌其他孩子。","FBI敦促公众在社交媒体、约会应用和其他在线平台上发布个人照片或视频时要谨慎小心。"]