Merge branch 'upstream' into concedo_experimental

# Conflicts: # examples/embedding/embedding.cpp # examples/infill/infill.cpp # examples/perplexity/perplexity.cpp # flake.lock # src/llama-sampling.cpp
2025-09-11 01:24:36 +00:00 · 2024-09-11 20:27:53 +08:00 · 2024-09-11 20:27:53 +08:00 · 13394368b6
commit 13394368b6
parent 7bdac9bc44 d2b496bff4
13 changed files with 100102 additions and 100106 deletions
--- a/examples/main/main.cpp
+++ b/examples/main/main.cpp
@ -192,8 +192,6 @@ int main(int argc, char ** argv) {

    print_build_info();

-    LOG_TEE("%s: seed = %u\n", __func__, params.sparams.seed);
-
    LOG("%s: llama backend init\n", __func__);
    llama_backend_init();
    llama_numa_init(params.numa);
@ -471,8 +469,10 @@ int main(int argc, char ** argv) {
        exit(1);
    }

+    LOG_TEE("sampling seed: %u\n", gpt_sampler_get_seed(smpl));
    LOG_TEE("sampling params: \n%s\n", sparams.print().c_str());
-    LOG_TEE(" sampler constr: \n%s\n", gpt_sampler_print(smpl).c_str());
+    LOG_TEE("sampler constr: \n%s\n", gpt_sampler_print(smpl).c_str());
+
    LOG_TEE("generate: n_ctx = %d, n_batch = %d, n_predict = %d, n_keep = %d\n", n_ctx, params.n_batch, params.n_predict, params.n_keep);

    // group-attention state