百度の文心大モデルERNIE-4.5-21B-A3B-Thinkingがオープンソース化され、Hugging Faceでテキスト生成1位を獲得。軽量MoEアーキテクチャ(総パラメータ21B、活性化3B)で効率的な推論を実現。....
Baidu
-
入力トークン/百万
出力トークン/百万
コンテキスト長
wekW
このモデルは、百度のERNIE-4.5-21B-A3B-ThinkingモデルのGGUF量子化バージョンで、Q8_0量子化形式を採用し、llama.cppツールで変換され、GGUF形式に対応した推論フレームワークで使用できます。
nightmedia
これは百度のERNIE-4.5-21B-A3B-ThinkingモデルのMLX形式変換バージョンで、mlx-lm 0.27.1ツールを使用して変換され、Apple Siliconデバイス用に最適化され、効率的な推論をサポートします。