PyTorch 2.8重磅發佈:量化LLM推理性能飛躍,Intel GPU 支持來襲!
PyTorch 2.8正式發佈,重點提升量化大語言模型在Intel CPU上的推理性能,支持A16W8等多種量化模式,測試顯示端到端延遲降低20%以上。新增對Intel GPU分佈式後端的實驗性支持,擴展硬件兼容性。其他改進包括:SYCL支持增強C++擴展API、XPU設備新增A16W4模式、穩定libtorch ABI接口、增強ROCm支持並新增gfx950架構。新版本還優化了控制流操作,提升模型編譯效率。下載地址:https://github.com/pytorch/pytorch/releases/tag/v2.8.0