DeepSeek-V4發佈僅10小時,北京大學DCAI團隊便通過最新開源的One-Eval評測框架,快速生成全量自動化評測報告。傳統大模型評測流程繁瑣,需耗費大量精力在搭建測試管道上,而One-Eval顯著提升了效率,標誌着行業進入新階段。