スマホで大型言語モデルの速度が5倍速!マイクロソフトアジア研究院が新技術をオープンソース化 CPUでも高速体験が可能に
T-MAC(Table-Lookup-based MAC)技術は、エッジデバイスにおける大規模言語モデル(LLM)のメモリと計算能力の制限問題を解決することを目的としています。モデルの重みを低ビット表現に量子化することで、T-MACは従来の乗算演算をルックアップテーブル(LUT)で置き換え、CPU上での実行効率を大幅に向上させます。この手法は、演算に必要なメモリを大幅に削減し、数十億パラメータのLLMをリソースの限られたデバイス上で効率的に実行し、スマートアップグレードを実現します。既存の実装と比較して、T-