revert auto rope scaling for already-ropetuned models - just use their values

2025-09-10 17:14:36 +00:00 · 2023-11-24 14:20:36 +08:00 · 2023-11-24 14:20:36 +08:00 · eb42c73953
commit eb42c73953
parent 56a5fa7a60
3 changed files with 70 additions and 46 deletions
--- a/gpttype_adapter.cpp
+++ b/gpttype_adapter.cpp
@ -941,19 +941,19 @@ ModelLoadResult gpttype_load_model(const load_model_inputs inputs, FileFormat in
            llamamodel->hparams.rope_freq_scale_train!=1.0f ||
            llamamodel->hparams.rope_scaling_type_train==2)
            {
-                float ropemultiplier = 1.0f;
-                if(llamamodel->hparams.rope_scaling_type_train!=2 &&
-                llamamodel->hparams.n_ctx_train > 2048 && clamped_max_context_length > llamamodel->hparams.n_ctx_train)
-                {
-                    ropemultiplier = (float)llamamodel->hparams.n_ctx_train / (float)clamped_max_context_length;
-                    llama_ctx_params.rope_freq_base = rope_freq_base = llamamodel->hparams.rope_freq_base_train;
-                    llama_ctx_params.rope_freq_scale = rope_freq_scale = ropemultiplier * llamamodel->hparams.rope_freq_scale_train;
-                    printf("Automatic RoPE Scaling: Using (scale:%.3f, base:%.1f).\n", rope_freq_scale, rope_freq_base);
-                }
-                else
-                {
+                // float ropemultiplier = 1.0f;
+                // if(llamamodel->hparams.rope_scaling_type_train!=2 &&
+                // llamamodel->hparams.n_ctx_train > 2048 && clamped_max_context_length > llamamodel->hparams.n_ctx_train)
+                // {
+                //     ropemultiplier = (float)llamamodel->hparams.n_ctx_train / (float)clamped_max_context_length;
+                //     llama_ctx_params.rope_freq_base = rope_freq_base = llamamodel->hparams.rope_freq_base_train;
+                //     llama_ctx_params.rope_freq_scale = rope_freq_scale = ropemultiplier * llamamodel->hparams.rope_freq_scale_train;
+                //     printf("Automatic RoPE Scaling: Using (scale:%.3f, base:%.1f).\n", rope_freq_scale, rope_freq_base);
+                // }
+                // else
+                // {
                    printf("Automatic RoPE Scaling: Using model internal value.\n");
-                }
+                //}
            }
            else
            {