Merge pull request #1409 from rnwang04/fix_fp16

revert using FP16 in XPU
2025-09-08 05:29:29 +00:00 · 2025-07-01 15:00:41 +08:00 · 2025-07-01 15:00:41 +08:00 · f96aab3c85
commit f96aab3c85
parent 495ae37478 5b5deda420
1 changed files with 3 additions and 2 deletions
--- a/ktransformers/local_chat.py
+++ b/ktransformers/local_chat.py
@ -79,8 +79,9 @@ def local_chat(
    if mode == 'long_context':
        assert config.architectures[0] == "LlamaForCausalLM", "only LlamaForCausalLM support long_context mode"
        torch.set_default_dtype(torch.float16)
-    elif xpu_fp16_model(config):
+    # elif xpu_fp16_model(config):
-        torch.set_default_dtype(torch.float16)
+    #     # using FP16 may cause accuracy issues, triggering core dumped during runtime
    #     torch.set_default_dtype(torch.float16)
    else:
        torch.set_default_dtype(config.torch_dtype)