AI检测公司GPTZero发现,2025年NeurIPS大会的4841篇录用论文中,有51篇包含至少100处虚假引用。这些引用由AI生成,包含虚构的作者和URL,被称为“伪原创引用”,尽管经过同行评审仍未被发现。
苹果在ICLR2025提交的视觉推理论文宣称超越GPT-5,但遭研究员复现揭露严重问题:官方代码缺失图片输入模块,修复后准确率暴跌;抽查发现30%标注数据存在错误。作者团队在GitHub草率关闭问题反馈后,最终承认数据生成流程存在缺陷。该事件暴露论文评审机制漏洞,引发学界对AI研究可复现性的担忧。(140字)
ICLR 2026 审稿系统遭 AI 大规模渗透:检测显示 7.6 万份评审中,21% 完全由大模型生成,35% 被 AI 润色,仅 43% 为纯人类撰写。机器评审更长、打分虚高,却频现“幻觉引用”等错误,引发作者集体抗议。组委会紧急发布严格禁令,拟从投稿端封杀 AI 生成内容以重建信任。
知名预印本平台arXiv更新计算机科学类别审核规则,要求综述论文和立场论文必须事先获得期刊或会议正式接收并完成同行评审后才能提交,以应对AI生成或辅助论文激增带来的管理挑战。
基于AI的论文和应用界面的同行评审
AI简历评审,助你脱颖而出
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
一个用于GitLab代码审查的MCP服务器,支持AI助手通过GitLab API审查合并请求,提供完整的变更分析、文件差异比较和评审管理功能。
一个基于Model Context Protocol的多模型AI代码审查与分析服务器,支持OpenAI、Anthropic、Google Gemini等多种AI模型并行执行代码质量检查、安全分析和多智能体共识评审。
一个基于MCP协议的多智能体辩论框架,用于代码审查和辩论规划,通过并行执行多个AI代理(如Claude、Codex)进行代码评审,采用确定性评分系统(P0/P1/P2严重性分级)和平台特定规则,最终合并结果生成评审报告。