SuperCLUE 2025年度中文大模型基準測評報告發布,23個國內外模型參與。評測涵蓋數學推理、科學推理、代碼生成等六大維度。結果顯示,海外閉源模型仍處領先地位,Anthropic的Claude-Opus-4.5-Reasoning以68.25分位居榜首,谷歌Gemini-3-Pro-Preview和OpenAI模型緊隨其後。
谷歌Gemini系列AI模型迎來新進展,預覽版"gemini-3-pro-preview-11-2025"在Vertex AI平臺被發現,預計本月正式推出。該模型支持100萬token超大上下文窗口,標識明確指向11月發佈。Vertex AI作爲谷歌雲端AI開發核心工具,已在網絡日誌中暴露相關信息。