人工智能浪潮下,新一代DDR5内存严重断货。Meta联合台积电、美光等开发出过渡方案,让仅支持DDR5的AI服务器能稳定运行DDR4内存。这套“缝合怪”系统实测稳定性出众,有效避免数据中心建设受阻。
阿里国际数字商业团队推出Marco-Mini-Instruct模型,参数量17.3B,激活参数仅0.86B,推理效率高,可在普通CPU上流畅运行。采用8bit量化与4条DDR4 2400内存时,推理速度约30token/s,推动MoE架构实用化。