Revert "vulkan: matmul dequantization improvements (#12015)"

This reverts commit fbeda9002d.
2025-09-14 02:49:41 +00:00 · 2025-03-05 00:02:47 +08:00 · 2025-03-05 00:02:47 +08:00 · 26b71e33b1
commit 26b71e33b1
parent 6b7d2349a7
5 changed files with 53 additions and 93 deletions
--- a/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp
+++ b/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp
@ -331,17 +331,11 @@ void matmul_shaders(bool fp16, bool matmul_id, bool coopmat, bool coopmat2, bool
    string_to_spv(shader_name + "_f16", source_name, merge_maps(base_dict, {{"DATA_A_F16", "1"}, {"B_TYPE", "float16_t"}, {"D_TYPE", "float"}}), fp16, coopmat, coopmat2, f16acc);

    for (const auto& tname : type_names) {
-        std::string load_vec_quant = "2";
-        if ((tname == "q4_0") || (tname == "q4_1"))
-            load_vec_quant = "8";
-        else if ((tname == "q5_0") || (tname == "q5_1") || (tname == "q8_0") || (tname == "iq4_nl"))
-            load_vec_quant = "4";
-
        std::string data_a_key = "DATA_A_" + to_uppercase(tname);
        // For unaligned, load one at a time for f32/f16, or two at a time for quants
-        std::string load_vec_a_unaligned = (coopmat2 || tname == "f32" || tname == "f16") ? "1" : load_vec_quant;
+        std::string load_vec_a_unaligned = (coopmat2 || tname == "f32" || tname == "f16") ? "1" : "2";
        // For aligned matmul loads
-        std::string load_vec_a = (coopmat2 || tname == "f32" || tname == "f16") ? load_vec : load_vec_quant;
+        std::string load_vec_a = (coopmat2 || tname == "f32" || tname == "f16") ? load_vec : "2";

        // don't generate f32 variants for coopmat2
        if (!coopmat2) {