llama-cpp-turboquant

C++ ★ 1.9k updated 2h ago ⑂ fork

LLM inference in C/C++

No plain-English explanation yet — one is being written right now. Check back in a minute.