nemo
Some checks failed
Python application / build (push) Has been cancelled

Co-authored-by: APodoinikov <APodoynikov@detmir.ru>
This commit is contained in:
illian64 2025-10-12 16:29:03 +07:00 committed by GitHub
parent 07154e93d4
commit cde657a761
No known key found for this signature in database
GPG key ID: B5690EEEBB952194
9 changed files with 213 additions and 20 deletions

View file

@ -0,0 +1,23 @@
# Плагин обработки файлов: media
Часть параметров, общих для всех плагинов, описана [здесь](../processing_files.md).
## Параметры плагина
* **model** - модель для распознавания звука.
В данный момент основные модели - маленькая `nvidia/parakeet-tdt-0.6b-v3`, и большая `nvidia/canary-1b-v2`.
* **cuda** - `true` - использовать видеокарту (быстрее), `false` - использовать cpu (медленнее).
* **cuda_device_index** - если в системе несколько видеокарт, можно выбрать ту, в которую будет загружена модель.
Номер и имя видеокарты указывается при старте приложения в логе, вида `INFO GPU #0: NVIDIA GeForce RTX 4090`.
`0` - указываемый в параметре номер.
* **unload_model_after_processing** - выгружать модель из памяти после завершения обработки списка файлов. Можно использовать, если на карте мало памяти.
На этой модели замечены проблемы с этим параметром - модель так и остается в памяти, очищает память только перезапуск приложения.
* **translate_after_processing** - переводить субтитры сразу после распознавания. По умолчанию, будет запущен обработчик [srt-Файлов](file_srt.md).
* **output_file_name_template** - шаблон для имени файла.
* **batch_size** - размер пачки токенов на обработку, ускорение обработки за счет большего размера памяти.