llama : remove KV cache defragmentation logic (#15473)

ggml-ci
2025-09-12 01:54:37 +00:00 · 2025-08-22 12:22:13 +03:00 · 2025-08-22 12:22:13 +03:00 · 9ebebef62f
commit 9ebebef62f
parent ad5c975c2d
16 changed files with 32 additions and 440 deletions
--- a/common/common.cpp
+++ b/common/common.cpp
@ -1152,7 +1152,6 @@ struct llama_context_params common_context_params_to_llama(const common_params &
    cparams.yarn_orig_ctx     = params.yarn_orig_ctx;
    cparams.pooling_type      = params.pooling_type;
    cparams.attention_type    = params.attention_type;
-    cparams.defrag_thold      = params.defrag_thold;
    cparams.cb_eval           = params.cb_eval;
    cparams.cb_eval_user_data = params.cb_eval_user_data;
    cparams.offload_kqv       = !params.no_kv_offload;