llm-translate/doc/ru/plugins-file-processing/file_media_nemo.md
illian64 cde657a761
Some checks failed
Python application / build (push) Has been cancelled
nemo
Co-authored-by: APodoinikov <APodoynikov@detmir.ru>
2025-10-12 16:29:03 +07:00

2 KiB
Raw Blame History

Плагин обработки файлов: media

Часть параметров, общих для всех плагинов, описана здесь.

Параметры плагина

  • model - модель для распознавания звука. В данный момент основные модели - маленькая nvidia/parakeet-tdt-0.6b-v3, и большая nvidia/canary-1b-v2.

  • cuda - true - использовать видеокарту (быстрее), false - использовать cpu (медленнее).

  • cuda_device_index - если в системе несколько видеокарт, можно выбрать ту, в которую будет загружена модель. Номер и имя видеокарты указывается при старте приложения в логе, вида INFO GPU #0: NVIDIA GeForce RTX 4090. 0 - указываемый в параметре номер.

  • unload_model_after_processing - выгружать модель из памяти после завершения обработки списка файлов. Можно использовать, если на карте мало памяти. На этой модели замечены проблемы с этим параметром - модель так и остается в памяти, очищает память только перезапуск приложения.

  • translate_after_processing - переводить субтитры сразу после распознавания. По умолчанию, будет запущен обработчик srt-Файлов.

  • output_file_name_template - шаблон для имени файла.

  • batch_size - размер пачки токенов на обработку, ускорение обработки за счет большего размера памяти.