6月6日、面壁智能は最新の傑作であるMiniCPM4.0シリーズモデルを正式に発表しました。このシリーズは「史上最高の想像力を持つ小型モデル」として称賛されており、エッジ側のパフォーマンスが飛躍的に向上しただけでなく、技術革新においても新たな基準を打ち立てています。
MiniCPM4.0シリーズには、2つの重要な製品が含まれています。一つ目は8Bライトニングスパーション版で、その革新的なスパースアーキテクチャによって効率的な波を巻き起こしています。もう一つは、わずか0.5Bの軽量かつ機敏なバージョンで、「最強の小型モデル」として称されています。これらのモデルは、速度、効率、パフォーマンス、そして実用的な展開において卓越したパフォーマンスを示しています。
速度面では、MiniCPM4.0は極限状況下で220倍、通常状態では5倍の速度向上を達成しました。これは、システム全体でのスパース技術革新による加速により実現されました。効率的なデュアルフリッカーシフト技術により、モデルはテキストの長さに応じてスパースと密集なアテンションメカニズムを自動的に切り替えることができ、長文の処理を高速かつ効果的に実行し、エッジ側でのストレージ要件を大幅に削減します。これにより、類似のモデルであるQwen3-8Bよりもキャッシュストレージ容量を1/4に抑えることに成功しました。
効率面では、MiniCPM4.0は業界初のシステム全体でのコンテキストスパーションに関するオープンソースの革新的技術を提供しており、5%という非常に高いスパーション率で極限的な高速化を達成しました。また、独自の技術を統合し、アーキテクチャ層、システム層、推論層、データ層の各段階で全面的な最適化を行い、システム全体でのソフトウェアとハードウェアのスパース化を実現しました。
パフォーマンス面では、MiniCPM4.0は「小さなモデルでも大きな力を発揮する」伝統を引き継いでいます。0.5Bバージョンはわずか2.7%のトレーニングコストで半分のパラメータ数で性能が倍増しました。一方、8Bスパース版は22%のトレーニングコストでQwen3やGemma312Bと同等またはそれを超えるパフォーマンスを達成し、エッジ側での地位を確固たるものにしました。
実用面では、MiniCPM4.0は圧倒的な力を見せています。独自のCPM.cu高速エッジ側推論フレームワーク、投機的サンプリングの革新、モデル圧縮量子化の革新、エッジ側展開フレームワークの革新を通じて、モデルのサイズを90%削減しながらも速度を最大限に向上させ、エッジ側推論をスムーズに実現しました。
現在、このモデルはIntel、Qualcomm、MTK、Huawei Ascendなどの主要なチップに対応しており、複数のオープンソースフレームワーク上で展開されており、その適用範囲をさらに広げています。
モデルコレクション:
https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d
GitHub:
https://github.com/openbmb/minicpm