merge main; Add torch q8 linear

2026-04-30 21:00:07 +00:00 · 2025-03-14 05:52:07 -04:00 · 2025-03-14 05:52:07 -04:00 · ed8437413b
commit ed8437413b
parent 6c4ed59175
27 changed files with 1561 additions and 114 deletions
--- a/ktransformers/optimize/optimize_rules/DeepSeek-V2-Lite-Chat.yaml
+++ b/ktransformers/optimize/optimize_rules/DeepSeek-V2-Lite-Chat.yaml
@ -13,7 +13,7 @@
    kwargs:
      generate_device: "cuda"
      prefill_device: "cuda"
-      generate_op: "KLinearMarlin"
+      generate_op: "KLinearQ8"
      prefill_op: "KLinearTorch"

 - match:
@ -22,9 +22,9 @@
  replace:
    class: ktransformers.operators.linear.KTransformersLinear
    kwargs:
-      generate_device: "cuda"
+      generate_device: "cpu"
      prefill_device: "cuda"
-      generate_op: "KLinearMarlin"
+      generate_op: "KLinearTorch"
      prefill_op: "KLinearTorch"

 - match: