阿里国际数字商业团队推出Marco-Mini-Instruct模型,参数量17.3B,激活参数仅0.86B,推理效率高,可在普通CPU上流畅运行。采用8bit量化与4条DDR4 2400内存时,推理速度约30token/s,推动MoE架构实用化。