Co-authored-by: APodoinikov <APodoynikov@detmir.ru>
2 KiB
Плагин обработки файлов: media
Часть параметров, общих для всех плагинов, описана здесь.
Параметры плагина
-
model - модель для распознавания звука. В данный момент основные модели - маленькая
nvidia/parakeet-tdt-0.6b-v3, и большаяnvidia/canary-1b-v2. -
cuda -
true- использовать видеокарту (быстрее),false- использовать cpu (медленнее). -
cuda_device_index - если в системе несколько видеокарт, можно выбрать ту, в которую будет загружена модель. Номер и имя видеокарты указывается при старте приложения в логе, вида
INFO GPU #0: NVIDIA GeForce RTX 4090.0- указываемый в параметре номер. -
unload_model_after_processing - выгружать модель из памяти после завершения обработки списка файлов. Можно использовать, если на карте мало памяти. На этой модели замечены проблемы с этим параметром - модель так и остается в памяти, очищает память только перезапуск приложения.
-
translate_after_processing - переводить субтитры сразу после распознавания. По умолчанию, будет запущен обработчик srt-Файлов.
-
output_file_name_template - шаблон для имени файла.
-
batch_size - размер пачки токенов на обработку, ускорение обработки за счет большего размера памяти.