flash-linear-attention

★ 0 updated 1y ago ⑂ fork

Efficient implementations of state-of-the-art linear attention models in Pytorch and Triton

No plain-English explanation yet — one is being written right now. Check back in a minute.