Best AI评审 AI Tools & Models - Premium AI评审 News

AI News

NeurIPS 顶级 AI 大会深陷“虚假引用”丑闻:超100处文献凭空捏造

AI检测公司GPTZero发现，2025年NeurIPS大会的4841篇录用论文中，有51篇包含至少100处虚假引用。这些引用由AI生成，包含虚构的作者和URL，被称为“伪原创引用”，尽管经过同行评审仍未被发现。

10.7k 3 hours ago

NeurIPS 顶级 AI 大会深陷“虚假引用”丑闻:超100处文献凭空捏造

北京程序员通宵“扫雷”：苹果论文被曝30%基准数据出错，ICLR稿件紧急勘误

苹果在ICLR2025提交的视觉推理论文宣称超越GPT-5，但遭研究员复现揭露严重问题：官方代码缺失图片输入模块，修复后准确率暴跌；抽查发现30%标注数据存在错误。作者团队在GitHub草率关闭问题反馈后，最终承认数据生成流程存在缺陷。该事件暴露论文评审机制漏洞，引发学界对AI研究可复现性的担忧。（140字）

12.3k 8 hours ago

北京程序员通宵“扫雷”：苹果论文被曝30%基准数据出错，ICLR稿件紧急勘误

全球最顶尖的AI学术会议被 AI “攻陷” 超1.5万份审稿意见由 AI 代写

ICLR 2026 审稿系统遭 AI 大规模渗透：检测显示 7.6 万份评审中，21% 完全由大模型生成，35% 被 AI 润色，仅 43% 为纯人类撰写。机器评审更长、打分虚高，却频现“幻觉引用”等错误，引发作者集体抗议。组委会紧急发布严格禁令，拟从投稿端封杀 AI 生成内容以重建信任。

13.4k 2 days ago

全球最顶尖的AI学术会议被 AI “攻陷” 超1.5万份审稿意见由 AI 代写

应对 AI 论文泛滥:arXiv CS 类别综述论文设“前置评审”门槛

知名预印本平台arXiv更新计算机科学类别审核规则，要求综述论文和立场论文必须事先获得期刊或会议正式接收并完成同行评审后才能提交，以应对AI生成或辅助论文激增带来的管理挑战。

8.7k 1 days ago

应对 AI 论文泛滥:arXiv CS 类别综述论文设“前置评审”门槛

AI Products

editoReview.com

editoReview.com

基于AI的论文和应用界面的同行评审

resume-ai

resume-ai

AI简历评审，助你脱颖而出

Models

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao-Seed-Translation

Bytedance

Doubao-Seed-Translation

$1.2

Input tokens/M

$3.6

Output tokens/M

4

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Qwen3-Next-80B-A3B-Instruct

$2

Input tokens/M

-

Output tokens/M

256

Context Length

wan2.5-t2i-preview

Alibaba

wan2.5-t2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-i2v-preview

Alibaba

wan2.5-i2v-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-omni-flash-realtime

Alibaba

qwen3-omni-flash-realtime

$3.9

Input tokens/M

$15.2

Output tokens/M

64

Context Length

qwen3-tts-flash-realtime

Alibaba

qwen3-tts-flash-realtime

-

Input tokens/M

-

Output tokens/M

-

Context Length

MCP

GitLab Code Review

GitLab Code Review

一个用于GitLab代码审查的MCP服务器，支持AI助手通过GitLab API审查合并请求，提供完整的变更分析、文件差异比较和评审管理功能。

multi_mcp

Multi_mcp

一个基于Model Context Protocol的多模型AI代码审查与分析服务器，支持OpenAI、Anthropic、Google Gemini等多种AI模型并行执行代码质量检查、安全分析和多智能体共识评审。

debate-agent-mcp

Debate Agent Mcp

一个基于MCP协议的多智能体辩论框架，用于代码审查和辩论规划，通过并行执行多个AI代理（如Claude、Codex）进行代码评审，采用确定性评分系统（P0/P1/P2严重性分级）和平台特定规则，最终合并结果生成评审报告。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map