Merge pull request #906 from Azure-Tang/main

[Fix] Fix rocm example yaml
2025-09-10 06:14:58 +00:00 · 2025-03-16 10:27:59 +08:00 · 2025-03-16 10:27:59 +08:00 · 0e93a09d67
commit 0e93a09d67
parent 63604cac59 85c32fdd10
1 changed files with 2 additions and 2 deletions
--- a/ktransformers/optimize/optimize_rules/rocm/DeepSeek-V3-Chat.yaml
+++ b/ktransformers/optimize/optimize_rules/rocm/DeepSeek-V3-Chat.yaml
@ -12,7 +12,7 @@
  replace:
    class: ktransformers.operators.linear.KTransformersLinear  # optimized Kernel on quantized data types
    kwargs:
-      generate_device: "cuda"
+      generate_device: "cpu"
      prefill_device: "cuda"
      generate_op: "KLinearCPUInfer"
      prefill_op: "KLinearTorch"
@ -23,7 +23,7 @@
  replace:
    class: ktransformers.operators.linear.KTransformersLinear  # optimized Kernel on quantized data types
    kwargs:
-      generate_device: "cpu"
+      generate_device: "cuda"
      prefill_device: "cuda"
      generate_op: "KLinearQ8"
      prefill_op: "KLinearTorch"