kvcache-ai-ktransformers

mirror of https://github.com/kvcache-ai/ktransformers.git synced 2025-09-05 12:09:48 +00:00

History

Atream c9a0c44213 Update DeepSeek-V3-Chat-multi-gpu-fp8-linear-ggml-experts.yaml		2025-03-17 17:03:52 +08:00
..
optimize_rules	Update DeepSeek-V3-Chat-multi-gpu-fp8-linear-ggml-experts.yaml	2025-03-17 17:03:52 +08:00
optimize.py	optimize gguf dequant, save mem, support Q2_K	2025-02-22 06:13:01 +00:00