DeepSeek-V4が公開されてから10時間も経たないうちに、北京大学DCAIチームは最新のオープンソースOne-Eval評価フレームワークを使って、迅速に完全な自動化された評価レポートを作成しました。従来の大規模モデルの評価プロセスは煩雑で、テストパイプラインの構築に多くの労力を要していましたが、One-Evalは効率を大幅に向上させ、業界の新たな段階を示しています。