阿里國際數字商業團隊推出Marco-Mini-Instruct模型,參數量17.3B,激活參數僅0.86B,推理效率高,可在普通CPU上流暢運行。採用8bit量化與4條DDR4 2400內存時,推理速度約30token/s,推動MoE架構實用化。