use generation config from json file in official repo

2025-09-09 13:55:27 +00:00 · 2025-02-27 11:48:34 +00:00 · 2025-02-27 11:48:34 +00:00 · e645d84794
commit e645d84794
parent 9660b2cc1e
4 changed files with 57 additions and 21 deletions
--- a/ktransformers/local_chat.py
+++ b/ktransformers/local_chat.py
@ -110,15 +110,15 @@ def local_chat(
    optimize_and_load_gguf(model, optimize_config_path, gguf_path, config)
    
    try:
-            model.generation_config = GenerationConfig.from_pretrained(model_path)
-    except:
-            gen_config = GenerationConfig(
-                max_length=128,
-                temperature=0.7,
-                top_p=0.9,
-                do_sample=True
-            )
-            model.generation_config = gen_config
+        model.generation_config = GenerationConfig.from_pretrained(model_path)
+    except Exception as e:
+        print(f"generation config can't auto create, make default. Message: {e}")
+        gen_config = GenerationConfig(
+            temperature=0.6,
+            top_p=0.95,
+            do_sample=True
+        )
+        model.generation_config = gen_config
    # model.generation_config = GenerationConfig.from_pretrained(model_path)
    if model.generation_config.pad_token_id is None:
        model.generation_config.pad_token_id = model.generation_config.eos_token_id