updated tokenizer, added support for scratch buffers for neox and gpt2

2026-05-22 03:10:03 +00:00 · 2023-06-19 21:29:06 +08:00 · 2023-06-19 21:29:06 +08:00 · 8e2dc19dc6
commit 8e2dc19dc6
parent cb6daa3171
5 changed files with 115 additions and 75 deletions
--- a/gpttype_adapter.cpp
+++ b/gpttype_adapter.cpp
@ -387,9 +387,15 @@ ModelLoadResult gpttype_load_model(const load_model_inputs inputs, FileFormat in
        {
            printf("\nAttempting to apply LORA adapter: %s\n", lora_filename.c_str());

+            const char * lora_base_arg = NULL;
+            if (lora_base != "") {
+                printf("Using LORA base model: %s\n", lora_base.c_str());
+                lora_base_arg = lora_base.c_str();
+            }
+
            int err = llama_apply_lora_from_file(llama_ctx_v3,
                                                 lora_filename.c_str(),
-                                                 NULL,
+                                                 lora_base_arg,
                                                 n_threads);
            if (err != 0)
            {