yaml: fix Marlin AssertionError

Marlin quantized linear only supports GPU device, when change generate_op to "KLinearMarlin", generate_device need to be changed to "cuda" accordingly. Fixes: e5b001d76f ("Update readme; Format code; Add example yaml.")
2025-09-10 23:34:35 +00:00 · 2025-03-21 23:58:20 +08:00 · 2025-03-21 23:58:20 +08:00 · a12e8ab46e
commit a12e8ab46e
parent 05f6cede37
1 changed files with 1 additions and 1 deletions
--- a/ktransformers/optimize/optimize_rules/DeepSeek-V2-Lite-Chat.yaml
+++ b/ktransformers/optimize/optimize_rules/DeepSeek-V2-Lite-Chat.yaml
@ -22,7 +22,7 @@
  replace:
    class: ktransformers.operators.linear.KTransformersLinear
    kwargs:
-      generate_device: "cpu"
+      generate_device: "cuda"
      prefill_device: "cuda"
      generate_op: "KLinearMarlin"
      prefill_op: "KLinearTorch"