BLAST
Public[NeurIPS 2024] BLAST: Block Level Adaptive Structured Matrix for Efficient Deep Neural Network Inference
efficient-inferencelarge-language-modelsllamamatrix-factorizationmatrix-multiplicationmodel-compression
Heure de création:2024-09-28T01:24:51
Heure de mise à jour:2025-03-05T03:21:20
541
Stars
1
Stars Increase