fix for gemma3n

2025-09-10 09:04:36 +00:00 · 2025-07-10 17:39:08 +08:00 · 2025-07-10 17:39:08 +08:00 · c45b8dc56f
commit c45b8dc56f
parent b8c1fc7c9e
4 changed files with 58 additions and 35 deletions
--- a/gpttype_adapter.cpp
+++ b/gpttype_adapter.cpp
@ -2287,6 +2287,11 @@ ModelLoadResult gpttype_load_model(const load_model_inputs inputs, FileFormat in
        }
        //handle override tensor
        std::string tensoroverrides = inputs.override_tensors;
+        if(file_format_meta.model_architecture==GGUFArch::ARCH_GEMMA3N)
+        {
+            std::string forced = "per_layer_token_embd.weight=CPU"; //this tensor on gpu is problematic on unsloth q4_0
+            tensoroverrides = (tensoroverrides=="" ? forced: (forced+","+tensoroverrides));
+        }
        if(tensoroverrides!="" && ggml_backend_dev_count()>1)
        {
            printf("Handling Override Tensors for backends: ");