Merge: Testing speed of tensor cores vs MMQ

2025-09-11 01:24:36 +00:00 · 2023-10-28 16:41:42 +08:00 · 2023-10-28 16:41:42 +08:00 · 2ea3b567cf
commit 2ea3b567cf
parent 2fa1137890 41aee4df82
5 changed files with 154 additions and 28 deletions
--- a/llama.cpp
+++ b/llama.cpp
@ -1583,12 +1583,14 @@ static void llama_kv_cache_seq_shift(
 enum llama_fver {
    GGUF_FILE_VERSION_V1 = 1,
    GGUF_FILE_VERSION_V2 = 2,
+    GGUF_FILE_VERSION_V3 = 3,
 };

 static const char * llama_file_version_name(llama_fver version) {
    switch (version) {
        case GGUF_FILE_VERSION_V1: return "GGUF V1 (support until nov 2023)";
-        case GGUF_FILE_VERSION_V2: return "GGUF V2 (latest)";
+        case GGUF_FILE_VERSION_V2: return "GGUF V2";
+        case GGUF_FILE_VERSION_V3: return "GGUF V3 (latest)";
    }

    return "unknown";