AIbase
Biblioteca de productosNavegación de herramientasMCP

native-sparse-attention-pytorch

Public

Implementation of the sparse attention pattern proposed by the Deepseek team in their "Native Sparse Attention" paper

Hora de creación2025-02-19T11:37:52
Hora de actualización2025-03-27T05:09:21
663
Stars
4
Stars Increase