Awesome-Attention-Heads
Public一个很棒的资源库和一份关于大型语言模型注意力机制的可解释性的全面综述。
attention-head-miningattention-mechanismawesomechain-of-thoughtcircuit-analysiscognitive-neurosciencegptinterpretabilitylarge-language-modelsllm
创建时间:2024-07-03T22:35:48
更新时间:2025-06-25T20:16:49
https://arxiv.org/abs/2409.03752
353
Stars
1
Stars Increase