support smt and glm4

2025-09-10 14:51:06 +00:00 · 2025-07-24 12:31:01 +00:00 · 2025-07-24 12:31:01 +00:00 · 590fcb41cd
commit 590fcb41cd
parent 613f0b7c37
5 changed files with 95 additions and 7 deletions
--- a/ktransformers/server/args.py
+++ b/ktransformers/server/args.py
@ -2,6 +2,9 @@ import argparse
 from ktransformers.server.backend.args import ConfigArgs, default_args
 from ktransformers.util.utils import get_free_ports
 from transformers import AutoConfig
+from ktransformers.models.configuration_qwen3_moe import Qwen3MoeConfig
+from ktransformers.models.configuration_smallthinker import SmallthinkerConfig
+from ktransformers.models.configuration_glm4_moe import Glm4MoeConfig

 class ArgumentParser:
    def __init__(self, cfg):
@ -136,7 +139,20 @@ class ArgumentParser:
        self.cfg.server_port = args.port
        self.cfg.user_force_think = args.force_think
        
-        model_config = AutoConfig.from_pretrained(args.model_dir, trust_remote_code=True)
+        if args.model_name == "Qwen3MoeForCausalLM": 
+            model_config = Qwen3MoeConfig.from_pretrained(args.model_dir, trust_remote_code=True)
+        elif args.model_name == "Glm4MoeForCausalLM":
+            model_config = Glm4MoeConfig.from_pretrained(args.model_dir, trust_remote_code=True)
+        elif args.model_name == "SmallthinkerForCausalLM":
+            model_config = SmallthinkerConfig.from_pretrained(args.model_dir, trust_remote_code=True)
+            model_config._attn_implementation = "eager"  
+        else:
+            try:
+                model_config = AutoConfig.from_pretrained(args.model_dir, trust_remote_code=True) 
+            except:
+                raise ValueError(f"Model {args.model_name} not supported. Please check your model directory or model name.")
+
+
        if model_config.architectures[0] == "Qwen3MoeForCausalLM" or model_config.architectures[0] == "Qwen2MoeForCausalLM" :
            args.gpu_memory_size = args.cache_lens*2*2*model_config.num_hidden_layers*model_config.num_key_value_heads*model_config.head_dim
            args.architectures = model_config.architectures[0]