swa full used unless ctx shift and fast forward disabled

2025-09-10 17:14:36 +00:00 · 2025-05-21 22:47:45 +08:00 · 2025-05-21 22:47:45 +08:00 · 9f976e9c65
commit 9f976e9c65
parent 5b6ed445de e298d2fbd0
16 changed files with 1429 additions and 654 deletions
--- a/common/arg.cpp
+++ b/common/arg.cpp
@ -1446,6 +1446,14 @@ common_params_context common_params_parser_init(common_params & params, llama_ex
            params.n_keep = value;
        }
    ));
+    add_opt(common_arg(
+        {"--swa-full"},
+        string_format("use full-size SWA cache (default: %s)\n"
+            "[(more info)](https://github.com/ggml-org/llama.cpp/pull/13194#issuecomment-2868343055)", params.swa_full ? "true" : "false"),
+        [](common_params & params) {
+            params.swa_full = true;
+        }
+    ));
    add_opt(common_arg(
        {"--no-context-shift"},
        string_format("disables context shift on infinite text generation (default: %s)", params.ctx_shift ? "disabled" : "enabled"),