Qwen3-ASR-GGUF

C++ ★ 179 updated 1mo ago

将 Qwen3-ASR 的 LLM 部分导出为 GGUF，用 llama.cpp 进行加速推理。后者支持 Vulkan 和 Cuda 加速。

No plain-English explanation yet — one is being written right now. Check back in a minute.