llm-translate/doc/ru/plugins-file-processing/file_media_nemo.md

# Плагин обработки файлов: media

Часть параметров, общих для всех плагинов, описана [здесь](../processing_files.md).

## Параметры плагина

* **model** - модель для распознавания звука.
В данный момент основные модели - маленькая `nvidia/parakeet-tdt-0.6b-v3`, и большая `nvidia/canary-1b-v2`.

* **cuda** - `true` - использовать видеокарту (быстрее), `false` - использовать cpu (медленнее).

* **cuda_device_index** - если в системе несколько видеокарт, можно выбрать ту, в которую будет загружена модель.
  Номер и имя видеокарты указывается при старте приложения в логе, вида `INFO GPU #0: NVIDIA GeForce RTX 4090`.
  `0` - указываемый в параметре номер.

* **unload_model_after_processing** - выгружать модель из памяти после завершения обработки списка файлов. Можно использовать, если на карте мало памяти.
На этой модели замечены проблемы с этим параметром - модель так и остается в памяти, очищает память только перезапуск приложения.

* **translate_after_processing** - переводить субтитры сразу после распознавания. По умолчанию, будет запущен обработчик [srt-Файлов](file_srt.md).

* **output_file_name_template** - шаблон для имени файла.

* **batch_size** - размер пачки токенов на обработку, ускорение обработки за счет большего размера памяти.