Merge branch 'master' into concedo_experimental

# Conflicts: # CMakeLists.txt # README.md # tests/test-sampling.cpp
2025-09-11 01:24:36 +00:00 · 2024-02-08 17:33:03 +08:00 · 2024-02-08 17:33:03 +08:00 · f374dba49c
commit f374dba49c
parent 4cd571db89 a6e514a85f
4 changed files with 7 additions and 3 deletions
--- a/common/sampling.cpp
+++ b/common/sampling.cpp
@ -132,7 +132,7 @@ static void sampler_queue(
    const float         temp              = params.temp;
    const float         dynatemp_range    = params.dynatemp_range;
    const float         dynatemp_exponent = params.dynatemp_exponent;
-    const int32_t       top_k             = params.top_k <= 0 ? n_vocab : params.top_k;
+    const int32_t       top_k             = params.top_k;
    const float         top_p             = params.top_p;
    const float         min_p             = params.min_p;
    const float         tfs_z             = params.tfs_z;
--- a/examples/llava/README.md
+++ b/examples/llava/README.md
@ -21,7 +21,7 @@ After building, run: `./llava-cli` to see the usage. For example:
 ## Model conversion
- Clone `llava-v15-7b`` and `clip-vit-large-patch14-336`` locally:
+- Clone `llava-v15-7b` and `clip-vit-large-patch14-336` locally:
 ```sh
 git clone https://huggingface.co/liuhaotian/llava-v1.5-7b
--- a/llama.cpp
+++ b/llama.cpp
@ -8891,6 +8891,10 @@ void llama_sample_top_k(struct llama_context * ctx, llama_token_data_array * can
    const int64_t t_start_sample_us = ggml_time_us();
    if (k <= 0) {
        k = candidates->size;
    }
    k = std::max(k, (int) min_keep);
    k = std::min(k, (int) candidates->size);
--- a/tests/.gitignore
+++ b/tests/.gitignore
@ -1,3 +1,3 @@
 *
 !*.*
-test-c.o
+*.o