support windows support q4_0 and q5_0 dequant on cpu Add CopyRight from pygguf(It was added before, but disappear after merge). Add some TODO in the code.

2025-09-10 23:34:35 +00:00 · 2024-08-07 12:19:06 +08:00 · 2024-08-07 12:19:06 +08:00 · 0a2fd52cea
commit 0a2fd52cea
parent 442e13bc97
32 changed files with 248 additions and 108 deletions
--- a/ktransformers/local_chat.py
+++ b/ktransformers/local_chat.py
@ -112,4 +112,4 @@ def local_chat(
        generated = prefill_and_generate(model, tokenizer, input_tensor.cuda(), max_new_tokens)

 if __name__ == "__main__":
-    fire.Fire(local_chat)
+    fire.Fire(local_chat)