new gpt2 format supported

2025-09-10 17:14:36 +00:00 · 2023-04-08 17:35:36 +08:00 · 2023-04-08 17:35:36 +08:00 · d8e37bfe75
commit d8e37bfe75
parent 1369b46bb7
12 changed files with 962 additions and 51 deletions
--- a/expose.cpp
+++ b/expose.cpp
@ -31,19 +31,19 @@ extern "C"
        std::string model = inputs.model_filename;
        file_format = check_file_format(model.c_str());

-        if(file_format==FileFormat::GPTJ1 || file_format==FileFormat::GPTJ2 || file_format==FileFormat::GPTJ3)
+        if(file_format==FileFormat::GPTJ_1 || file_format==FileFormat::GPTJ_2 || file_format==FileFormat::GPTJ_3)
        {
            printf("\n---\nIdentified as GPT-J model: (ver %d)\nAttempting to Load...\n---\n", file_format);
            ModelLoadResult lr = gpttype_load_model(inputs, file_format);
            if (lr == ModelLoadResult::RETRY_LOAD)
            {
-                file_format = FileFormat::GPTJ2;
+                file_format = FileFormat::GPTJ_2;
                printf("\n---\nRetrying as GPT-J model: (ver %d)\nAttempting to Load...\n---\n", file_format);
                lr = gpttype_load_model(inputs, file_format);
            }
            if (lr == ModelLoadResult::RETRY_LOAD)
            {
-                file_format = FileFormat::GPTJ3;
+                file_format = FileFormat::GPTJ_3;
                printf("\n---\nRetrying as GPT-J model: (ver %d)\nAttempting to Load...\n---\n", file_format);
                lr = gpttype_load_model(inputs, file_format);
            }
@ -57,10 +57,16 @@ extern "C"
                return true;
            }
        }
-        else if(file_format==FileFormat::GPT2)
+        else if(file_format==FileFormat::GPT2_1||file_format==FileFormat::GPT2_2)
        {
            printf("\n---\nIdentified as GPT-2 model: (ver %d)\nAttempting to Load...\n---\n", file_format);
            ModelLoadResult lr = gpttype_load_model(inputs, file_format);
+            if (lr == ModelLoadResult::RETRY_LOAD)
+            {
+                file_format = FileFormat::GPT2_2;
+                printf("\n---\nRetrying as GPT-2 model: (ver %d)\nAttempting to Load...\n---\n", file_format);
+                lr = gpttype_load_model(inputs, file_format);
+            }
            if (lr == ModelLoadResult::FAIL || lr == ModelLoadResult::RETRY_LOAD)
            {
                return false;
@ -79,7 +85,8 @@ extern "C"

    generation_outputs generate(const generation_inputs inputs, generation_outputs &output)
    {
-        if (file_format == FileFormat::GPTJ1 || file_format == FileFormat::GPTJ2 || file_format==FileFormat::GPTJ3 || file_format==FileFormat::GPT2)
+        if (file_format == FileFormat::GPTJ_1 || file_format == FileFormat::GPTJ_2 || file_format==FileFormat::GPTJ_3 
+        || file_format==FileFormat::GPT2_1 || file_format==FileFormat::GPT2_2 )
        {
            return gpttype_generate(inputs, output);
        }