人工智能浪潮下,新一代DDR5內存嚴重斷貨。Meta聯合臺積電、美光等開發出過渡方案,讓僅支持DDR5的AI服務器能穩定運行DDR4內存。這套“縫合怪”系統實測穩定性出衆,有效避免數據中心建設受阻。
阿里國際數字商業團隊推出Marco-Mini-Instruct模型,參數量17.3B,激活參數僅0.86B,推理效率高,可在普通CPU上流暢運行。採用8bit量化與4條DDR4 2400內存時,推理速度約30token/s,推動MoE架構實用化。