init

2026-04-28 20:00:12 +00:00 · 2025-07-27 17:54:21 +07:00 · 2025-07-27 17:54:21 +07:00 · 8557624008
commit 8557624008
29 changed files with 2560 additions and 0 deletions
--- a/plugins/plugin_madlab_ctranslate2.py
+++ b/plugins/plugin_madlab_ctranslate2.py
@ -0,0 +1,100 @@
+import os
+
+import ctranslate2
+import transformers
+from ctranslate2 import Translator
+from tqdm import tqdm
+from transformers import PreTrainedTokenizerBase
+
+from app import cuda, struct
+from app.app_core import AppCore
+from app.struct import TranslateStruct, tp
+
+modname = os.path.basename(__file__)[:-3]
+
+model: Translator
+tokenizer: PreTrainedTokenizerBase
+
+
+def start(core: AppCore):
+    manifest = {  # plugin settings
+        "name": "Madlab CTranslate2",  # name
+        "version": "1.0",  # version
+
+        "translate": {
+            "madlab_ctranslate2": (init, translate)  # 1 function - init, 2 - translate
+        },
+
+        "default_options": {
+            "model": "models/madlad400-10b-mt-bfloat16",  # key model
+            "tokenizer": "jbochi/madlad400-10b-mt",  # transformers.AutoTokenizer
+            "compute_type": "bfloat16",
+            "cuda": True,  # false if you want to run on CPU, true - if on CUDA
+            "cuda_device_index": 0,  # GPU index (if you have more than one GPU)
+            "max_batch_size": 16,  # batch processing requests, increase need to more memory
+
+            "text_split_params": {
+                "split_by_sentences_only": True,
+            }
+        },
+    }
+
+    return manifest
+
+
+def start_with_options(core: AppCore, manifest:dict):
+    struct.read_plugin_params(manifest)
+
+    return manifest
+
+
+def init(core:AppCore):
+    options = core.plugin_options(modname)
+
+    global model
+    global tokenizer
+
+    model = ctranslate2.Translator(options["model"],
+                                   device=cuda.get_device(options), device_index=options["cuda_device_index"])
+    tokenizer = transformers.AutoTokenizer.from_pretrained(options["tokenizer"])
+
+    return modname
+
+
+def translate(core: AppCore, ts: TranslateStruct):
+    options = core.plugin_options(modname)
+
+    # # implementation 1: one part - one batch
+    # for part in ts.parts:
+    #     if not part.text or part.text == "":
+    #         part.translate = ""
+    #     else:
+    #         input_text = "<2" + ts.req.to_lang + ">" + part.text
+    #         tokens = tokenizer.convert_ids_to_tokens(tokenizer.encode(input_text))
+    #         translate_results = model.translate_batch([tokens])
+    #         output_tokens = translate_results[0].hypotheses[0]
+    #         decoded_text = tokenizer.decode(tokenizer.convert_tokens_to_ids(output_tokens))
+    #         part.translate = decoded_text
+
+    # implementation 2: all parts - one batch. It's faster, but depends on amount of batches.
+    tokens_list = []
+    for part in tqdm(ts.parts, unit=tp.unit, ascii=tp.ascii, desc=tp.desc):
+        if part.need_to_translate():
+            input_text = "<2" + ts.req.to_lang + ">" + part.text
+            tokens = tokenizer.convert_ids_to_tokens(tokenizer.encode(input_text))
+            tokens_list.append(tokens)
+
+    translate_results = model.translate_batch(
+        tokens_list, max_batch_size=options["max_batch_size"], beam_size=1, return_scores=False, disable_unk=False)
+
+    i = 0
+    for part in ts.parts:
+        if part.text and part.text != "":
+            output_tokens = translate_results[i].hypotheses[0]
+            decoded_text = tokenizer.decode(tokenizer.convert_tokens_to_ids(output_tokens))
+            part.translate = decoded_text
+            i += 1
+        else:
+            part.translate = ""
+
+    return ts