DeepSeek-V4が公開されてから10時間も経たないうちに、北京大学DCAIチームは最新のオープンソースOne-Eval評価フレームワークを使って、迅速に完全な自動化された評価レポートを作成しました。従来の大規模モデルの評価プロセスは煩雑で、テストパイプラインの構築に多くの労力を要していましたが、One-Evalは効率を大幅に向上させ、業界の新たな段階を示しています。
アリババの大規模AIモデル「通義千問」の技術責任者、林俊旸氏が退任。1993年生まれの若手専門家で、北京大学でコンピュータと言語学を複合専攻し、学際的な能力でモデルの意味理解と長文処理を牽引した。....
長動画理解に権威的な評価基準が登場。LoVR基準がWWW 2026に採用され、長動画の多粒度検索評価の空白を埋めた。中心的な突破点は、長動画検索の3つの課題を解決したことで、従来の基準では現実的な長動画の需要に対応できなかった。
北京大学第三医院などの機関が共同で発表したAI医療大モデル「羲和一号」は、千億スケールのパラメータと百万件の病歴データを使用し、医学知識のカバー率は98%、正確率は90%を超えています。これは、医療サービスのスマート化を促進することを目的としています。
Mungert
FairyR1-32Bは北京大学DS-LABが開発した効率的な大規模言語モデルで、DeepSeek-R1-Distill-Qwen-32Bを基に、'蒸留-融合'という革新的なプロセスにより高性能と低コスト推論のバランスを実現しています。