面壁智能は清華大学、OpenBMBオープンソースコミュニティと共同で、新世代のエッジ側マルチモーダル大規模モデルMiniCPM-V4.6をリリース。パラメータ数はわずか1.3Bで、InstructとThinkingの2バージョンを提供。高い知能密度とクロスプラットフォーム適応能力により、複数の評価でより大きなパラメータモデルを凌駕し、エッジ側AIアプリケーションの実装を加速する。....
面壁智能は清華大学、OpenBMBオープンソースコミュニティと協力し、低ビット大規模モデル訓練成果BitCPM-CANNを発表・公開した。これはHuawei昇騰プラットフォームでネイティブに完成した。0.5Bから8Bの4つのモデルサイズを含み、性能が優れており、6倍のメモリ効率を実現し、エッジ側AI大規模モデルの軽量化と実用化を大きく推進する。....
面壁智能、清華大学、OpenBMBオープンソースコミュニティが協力し、中国初の华为昇腾プラットフォームに基づく三値(1.58ビット)大規模モデルBitCPM-CANNを公開・オープンソース化。低ビット訓練分野でブレークスルーを達成し、量子化演算子から訓練アルゴリズムまでの全チェーンをネイティブ開発。0.5Bから8Bの4サイズ版を提供し、国産計算プラットフォームの強力な実力を示した。....
面壁智能、清華大学、OpenBMBコミュニティがMiniCPM-V 4.6をリリース。わずか1.3Bパラメータ、6GBメモリで動作し、メモリコスト高騰の中、低メモリ・高速処理を実現、AI応用の新たな可能性を開拓。....
openbmb
MiniCPM4.1-8B-GGUFはMiniCPM4.1-8BモデルのGGUF量子化形式のバージョンで、エッジデバイス向けに設計された効率的な大規模言語モデルです。80億のパラメータを持ち、融合思考をサポートし、典型的なエッジチップで5倍以上の生成速度向上を実現します。
MiniCPM4は、エッジデバイス向けに設計された高効率な大規模言語モデルです。同じ規模のモデルで最高の性能を維持しながら、極限までの効率向上を実現し、典型的なエッジチップでは5倍以上の生成速度向上を達成します。
AyyYOO
MiniCPM4-8B-Q8_0-GGUFは、llama.cppを使用してopenbmb/MiniCPM4-8BをGGUF形式に変換したモデルで、ローカル推論に適しています。
MiniCPM4はエッジデバイス向けに設計された高効率大規模言語モデルで、同じ規模の中で極限までの効率向上と最適な性能を実現しています。
MiniCPM4-MCPはオープンソースのエッジサイド大規模言語モデルのインテリジェントエージェントモデルで、80億パラメータのMiniCPM - 4をベースに構築されており、MCPを通じて様々なツールやデータリソースとインタラクションし、幅広い現実世界のタスクを解決することができます。
MiniCPM4はエッジデバイス向けに設計された高効率大規模言語モデルで、システム革新によりモデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの重要な次元で極限までの効率向上を実現しています。
MiniCPM4はエッジデバイス向けに設計された高効率大規模言語モデルで、システム革新によりモデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの次元で極限までの効率向上を実現し、エッジチップ上で5倍以上の生成速度向上を達成します。
AgentCPM-GUIはRFT強化推論能力を備えたデバイスサイドのグラフィカルインターフェースエージェントで、中国語と英語のアプリを操作可能、80億パラメータのMiniCPM-Vを基に構築されています。
MiniCPM-S-1B-sftは、活性化スパース化技術で最適化された10億パラメータ規模の言語モデルで、ProSparseメソッドにより高スパース推論加速を実現しつつ、元のモデルと同等の性能を維持しています。
このモデルは、意味テキスト類似度や分類タスクを含む複数の中国語と英語のデータセットでテストされました。
MiniCPM-o 2.6のint4量子化バージョンで、GPUのVRAM使用量を大幅に削減し、マルチモーダル処理能力をサポートします。
MiniCPM-o 2.6はマルチモーダルモデルで、視覚と言語タスクをサポートし、llama.cpp向けに設計されています。
MiniCPM-o 2.6はスマートフォンで動作するGPT-4oレベルのマルチモーダル大規模モデルで、視覚、音声、ライブストリーム処理をサポート
VisRAGは視覚言語モデル(VLM)に基づく検索拡張生成(RAG)システムで、文書を画像として直接埋め込み表現でき、従来のテキスト解析による情報損失を回避します。
MiniCPM-再ランキングモデルは、面壁智能と清華大学自然言語処理研究所、東北大学情報検索グループが共同開発した中日バイリンガルテキスト再ランキングモデルで、優れた中日およびクロスランゲージ再ランキング能力を備えています。
MiniCPM-Embedding は MiniCPM-2B-sft-bf16 ベースモデルを基に開発された埋め込みモデルで、検索タスクに特化し、中国語と英語の二言語をサポートします。
MiniCPM3-4BはMiniCPMシリーズの第3世代モデルで、全体的な性能がPhi-3.5-mini-InstructとGPT-3.5-Turbo-0125を上回り、最近の複数の7B~9B規模のモデルと同等のパフォーマンスを発揮します。
MiniCPM-Vはモバイル端末向けのGPT-4Vレベルのマルチモーダル大規模言語モデルで、単一画像、複数画像、動画の理解をサポートし、視覚、光学文字認識などの機能を備えています。
MiniCPM-V 2.6はマルチモーダルな視覚言語モデルで、画像テキストからテキストへの変換をサポートし、多言語処理能力を備えています。
MiniCPM-Llama3-V 2.5のint4量子化バージョンで、GPU VRAM使用量を約9GBに大幅に削減し、視覚質問応答タスクに適しています。