support smt and glm4

2025-09-16 18:19:42 +00:00 · 2025-07-24 12:31:01 +00:00 · 2025-07-24 12:31:01 +00:00 · 590fcb41cd
commit 590fcb41cd
parent 613f0b7c37
5 changed files with 95 additions and 7 deletions
--- a/ktransformers/optimize/optimize_rules/Glm4Moe-serve.yaml
+++ b/ktransformers/optimize/optimize_rules/Glm4Moe-serve.yaml
@ -49,7 +49,7 @@
 - match:
    name: "^model\\.layers\\..*\\.mlp\\.experts$"
  replace:
-    class: ktransformers.operators.experts.KTransformersExpertsV2     # custom MoE Kernel with expert paralleism
+    class: ktransformers.operators.experts.KGlm4Experts     # custom MoE Kernel with expert paralleism
    kwargs:
      prefill_device: "cuda"
      prefill_op: None