llm-translate/doc/ru/plugins-file-processing/file_media_nemo.md
illian64 cde657a761
Some checks failed
Python application / build (push) Has been cancelled
nemo
Co-authored-by: APodoinikov <APodoynikov@detmir.ru>
2025-10-12 16:29:03 +07:00

23 lines
2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Плагин обработки файлов: media
Часть параметров, общих для всех плагинов, описана [здесь](../processing_files.md).
## Параметры плагина
* **model** - модель для распознавания звука.
В данный момент основные модели - маленькая `nvidia/parakeet-tdt-0.6b-v3`, и большая `nvidia/canary-1b-v2`.
* **cuda** - `true` - использовать видеокарту (быстрее), `false` - использовать cpu (медленнее).
* **cuda_device_index** - если в системе несколько видеокарт, можно выбрать ту, в которую будет загружена модель.
Номер и имя видеокарты указывается при старте приложения в логе, вида `INFO GPU #0: NVIDIA GeForce RTX 4090`.
`0` - указываемый в параметре номер.
* **unload_model_after_processing** - выгружать модель из памяти после завершения обработки списка файлов. Можно использовать, если на карте мало памяти.
На этой модели замечены проблемы с этим параметром - модель так и остается в памяти, очищает память только перезапуск приложения.
* **translate_after_processing** - переводить субтитры сразу после распознавания. По умолчанию, будет запущен обработчик [srt-Файлов](file_srt.md).
* **output_file_name_template** - шаблон для имени файла.
* **batch_size** - размер пачки токенов на обработку, ускорение обработки за счет большего размера памяти.