アリババのブラックテクノロジーが注目を集める!0.6Bの小さなモデルを17BのMoEに変換し、アクティブパラメータは5%に抑え、CPUで直接30token/sを実現!
アリババ国際デジタルビジネスチームがマーコ・ミニ・インストラクトモデルを発表しました。パラメータ数は17.3Bで、アクティブパラメータは0.86Bにとどまり、推論効率が高く、通常のCPUでもスムーズに動作します。8bitの量子化と4つのDDR4 2400メモリを使用する場合、推論速度は約30token/sとなり、MoEアーキテクチャの実用化を推進しています。