螞蟻集團開源dInfer框架,專用於擴散大語言模型高效推理。該框架將推理速度提升10倍,在保持同等模型性能下超越傳統自迴歸模型。自迴歸模型逐字生成文本速度受限,擴散模型通過去噪過程實現更高效推理,推動自然語言處理技術發展。
螞蟻集團開源業內首個高性能擴散語言模型推理框架dInfer,顯著提升推理速度。基準測試顯示,其比英偉達Fast-dLLM快10.7倍,在HumanEval代碼生成任務中單次推理達每秒1011個Tokens,推動技術邁向實際應用。
10月13日,螞蟻集團開源業界首個高性能擴散語言模型推理框架dInfer。基準測試顯示,其推理速度較英偉達Fast-dLLM提升10.7倍;在HumanEval代碼生成任務中,單批次推理速度達1011Tokens/秒,首次在開源社區實現擴散模型單批次推理速度超越自迴歸模型,證明擴散語言模型具有顯著效率潛力。