SuperCLUEが2025年中国語大モデル評価レポートを発表。数学的推論、コード生成など6次元で評価。海外のクローズドモデルが優勢で、AnthropicのClaude-Opus-4.5-Reasoningが68.25点で首位。....
SuperCLUE 2025年度中文大模型評価レポートが発表され、国内外23モデルが参加。数学推論、科学推論、コード生成など6次元で評価。結果は海外クローズドモデルが依然リードし、AnthropicのClaude-Opus-4.5-Reasoningが68.25点で首位、Google Gemini-3-Pro-PreviewとOpenAIモデルが続く。....