update rope calculation; update modeling.py; update gate for moe

2025-09-16 01:59:42 +00:00 · 2025-02-01 07:32:21 +00:00 · 2025-02-01 07:32:21 +00:00 · f873558a89
commit f873558a89
parent 5a50b34627
11 changed files with 402 additions and 412 deletions
--- a/ktransformers/server/config/config.py
+++ b/ktransformers/server/config/config.py
@ -102,7 +102,7 @@ class Config(metaclass=Singleton):
        self.total_context = self.model.get("total_context", 2**18)
        self.max_batch_size = self.model.get("max_batch_size", 20 if self.paged else 1)
        self.max_chunk_size = self.model.get("max_chunk_size", 2048)
-        self.max_new_tokens = self.model.get("max_new_tokens", 500)
+        self.max_new_tokens = self.model.get("max_new_tokens", 2000)
        self.json_mode = self.model.get("json_mode", False)
        self.healing = self.model.get("healing", False)
        self.ban_strings: Optional[list] = self.model.get("ban_strings", None)