SuperCLUE 2025年度中文大模型基准测评报告发布,23个国内外模型参与。评测涵盖数学推理、科学推理、代码生成等六大维度。结果显示,海外闭源模型仍处领先地位,Anthropic的Claude-Opus-4.5-Reasoning以68.25分位居榜首,谷歌Gemini-3-Pro-Preview和OpenAI模型紧随其后。
谷歌Gemini系列AI模型迎来新进展,预览版"gemini-3-pro-preview-11-2025"在Vertex AI平台被发现,预计本月正式推出。该模型支持100万token超大上下文窗口,标识明确指向11月发布。Vertex AI作为谷歌云端AI开发核心工具,已在网络日志中暴露相关信息。