手機跑大模型速度快5倍!微軟亞研院開源新技術 CPU上也能享受極速體驗
T-MAC(Table-Lookup-based MAC)技術旨在解決邊緣設備部署大型語言模型(LLMs)的內存和計算限制問題。通過將模型權重量化爲低比特表示,T-MAC利用查找表(LUT)替代傳統乘法運算,顯著提高了在CPU上的運行效率。這一方法大幅減少了運算所需內存,使數十億參數的LLMs能夠在資源受限的設備上高效運行,實現智能升級。與現有實現相比,T-MAC在吞吐量上提升4倍,能耗降低70%,即使在低端設備如Raspberry Pi 5上也能以接近成人閱讀速度的速度生成令牌。T-MAC不僅適用於智能手機的實時語音識別和自然語言處理,還能提升智能家居設備的交互體驗。作爲開源項目,T-MAC有望推動邊緣智能領域的發展,提供高效節能的LLM部署解決方案,爲用戶帶來更豐富、便捷的智能體驗。