update rope calculation; update modeling.py; update gate for moe

2025-09-10 15:29:39 +00:00 · 2025-02-01 07:32:21 +00:00 · 2025-02-01 07:32:21 +00:00 · f873558a89
commit f873558a89
parent 5a50b34627
11 changed files with 402 additions and 412 deletions
--- a/ktransformers/local_chat.py
+++ b/ktransformers/local_chat.py
@ -15,7 +15,7 @@ from ktransformers.server.args import ArgumentParser


 from ktransformers.models.modeling_deepseek import DeepseekV2ForCausalLM
-from ktransformers.models.modeling_deepseekv3 import DeepseekV3ForCausalLM
+from ktransformers.models.modeling_deepseek_v3 import DeepseekV3ForCausalLM
 from ktransformers.models.modeling_qwen2_moe import Qwen2MoeForCausalLM
 from ktransformers.models.modeling_llama import LlamaForCausalLM
 from ktransformers.models.modeling_mixtral import MixtralForCausalLM
@ -78,7 +78,7 @@ def local_chat():
                else:
                    content += line + "\n"
        if content == "":
-            if config.prompt_file == None or config.prompt_file == "":
+            if not config.prompt_file:
                content = "hi"
            else:
                content = open(config.prompt_file, "r").read()