Add complete Swedish (sv) translation for all documentation files including API Reference, README, and guides. Introduce automated i18n QA infrastructure with visual regression testing across multiple viewports and locales to validate translations.
40 KiB
Керівництво користувача
🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Повний посібник із налаштування постачальників, створення комбінацій, інтеграції інструментів CLI та розгортання OmniRoute.
Зміст
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
💰 Короткий огляд цін
| Рівень | Постачальник | Вартість | Скидання квоти | Найкраще для |
|---|---|---|---|---|
| 💳 ПІДПИСКА | Клод Код (Pro) | 20 доларів США на місяць | 5 годин + щотижня | Вже підписані |
| Codex (Plus/Pro) | $20-200/міс | 5 годин + щотижня | Користувачі OpenAI | |
| Gemini CLI | БЕЗКОШТОВНО | 180 тис./місяць + 1 тис./день | всі! | |
| Копілот GitHub | $10-19/міс | Щомісяця | Користувачі GitHub | |
| 🔑 КЛЮЧ API | DeepSeek | Оплата за використання | Жодного | Дешеві міркування |
| Groq | Оплата за використання | Жодного | Надшвидкий висновок | |
| xAI (Грок) | Оплата за використання | Жодного | Грок 4 міркування | |
| Містраль | Оплата за використання | Жодного | Моделі, розміщені в ЄС | |
| Розгубленість | Оплата за використання | Жодного | Search-augmented | |
| Разом AI | Оплата за використання | Жодного | Моделі з відкритим кодом | |
| Феєрверк AI | Оплата за використання | Жодного | Швидкі зображення FLUX | |
| Головний мозок | Оплата за використання | Жодного | Швидкість вафельної шкали | |
| Cohere | Оплата за використання | Жодного | Команда R+ RAG | |
| NVIDIA NIM | Оплата за використання | Жодного | Моделі підприємства | |
| 💰 ДЕШЕВО | GLM-4.7 | $0,6/1 млн | Щодня о 10 ранку | Резервне копіювання бюджету |
| MiniMax M2.1 | $0,2/1 млн | 5-годинний роликовий | Найдешевший варіант | |
| Кімі К2 | 9 $/міс квартира | 10 млн токенів/міс | Передбачувана вартість | |
| 🆓 БЕЗКОШТОВНО | iFlow | $0 | Необмежений | 8 моделей безкоштовно |
| Квен | $0 | Необмежений | 3 моделі безкоштовно | |
| Кіро | $0 | Необмежений | Клод безкоштовно |
💡 Порада професіонала: Почніть із Gemini CLI (180 тис. безкоштовно/місяць) + iFlow (необмежено безкоштовно) = 0 доларів США!
🎯 Випадки використання
Випадок 1: «У мене є підписка на Claude Pro»
Проблема: Квота закінчується невикористаною, обмеження швидкості під час інтенсивного кодування
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Випадок 2: "Я хочу нульову вартість"
Проблема: не можу дозволити собі підписку, потрібне надійне кодування ШІ
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Випадок 3: «Мені потрібне кодування 24/7, без перерв»
Проблема: Дедлайни, не можу дозволити собі простою
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
Випадок 4: «Я хочу БЕЗКОШТОВНОГО ШІ в OpenClaw»
Проблема: потрібен помічник штучного інтелекту в програмах для обміну повідомленнями, повністю безкоштовний
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
📖 Налаштування постачальника
🔐 Постачальники підписки
Claude Code (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001
Професійна порада: використовуйте Opus для складних завдань, Sonnet для швидкості. OmniRoute відстежує квоту на модель!
OpenAI Codex (Plus/Pro)
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-max
Gemini CLI (БЕЗКОШТОВНО 180K/місяць!)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-pro
Найкраще: Величезний безкоштовний рівень! Використовуйте це перед платними рівнями.
Копілот GitHub
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro
💰 Дешеві постачальники
GLM-4.7 (щоденне скидання, $0,6/1 млн)
- Зареєструйтеся: Zhipu AI
- Отримайте ключ API від Coding Plan
- Інформаційна панель → Додати ключ API: Постачальник:
glm, ключ API:your-key
Використання: glm/glm-4.7 — Порада професіонала: План кодування пропонує 3× квоту за 1/7 вартості! Скидання щодня о 10:00.
MiniMax M2.1 (5 годин скидання, $0,20/1 млн)
- Зареєструйтеся: MiniMax
- Отримати ключ API → Інформаційна панель → Додати ключ API
Використовуйте: minimax/MiniMax-M2.1 — Порада: Найдешевший варіант для довгого контексту (1 млн токенів)!
Kimi K2 ($9/місяць)
- Підпишіться: Moonshot AI
- Отримати ключ API → Інформаційна панель → Додати ключ API
Використання: kimi/kimi-latest — Порада професіонала: Фіксовані 9 доларів США на місяць за 10 мільйонів токенів = 0,90 доларів США за 1 млн. ефективних витрат!
🆓 БЕЗКОШТОВНІ постачальники
iFlow (8 БЕЗКОШТОВНИХ моделей)
Dashboard → Connect iFlow → OAuth login → Unlimited usage
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1
Qwen (3 БЕЗКОШТОВНІ моделі)
Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash
Кіро (Клод БЕЗКОШТОВНО)
Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
🎨 Комбо
Приклад 1: максимізація підписки → дешеве резервне копіювання
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Приклад 2: лише безкоштовно (нульова вартість)
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 Інтеграція CLI
Курсор IDE
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from omniroute dashboard]
Model: cc/claude-opus-4-6
Клод Код
Редагувати ~/.claude/config.json:
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-omniroute-api-key"
}
Codex CLI
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"
OpenClaw
Редагувати ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": { "primary": "omniroute/if/glm-4.7" }
}
},
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://localhost:20128/v1",
"apiKey": "your-omniroute-api-key",
"api": "openai-completions",
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
}
}
}
}
Або скористайтеся інформаційною панеллю: Інструменти CLI → OpenClaw → Auto-config
Cline / Продовжити / RooCode
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6
🚀 Розгортання
Розгортання VPS
git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
npm run start
# Or: pm2 start npm --name omniroute -- start
Докер
# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .
# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli
Для інтегрованого режиму з двійковими файлами CLI дивіться розділ Docker в основних документах.
Змінні середовища
| Змінна | За замовчуванням | Опис |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
Секрет підпису JWT (зміни у виробництві) |
INITIAL_PASSWORD |
123456 |
Перший пароль для входу |
DATA_DIR |
~/.omniroute |
Каталог даних (база даних, використання, журнали) |
PORT |
рамка за замовчуванням | Сервісний порт (20128 у прикладах) |
HOSTNAME |
рамка за замовчуванням | Прив’язати хост (Docker за замовчуванням 0.0.0.0) |
NODE_ENV |
виконання за замовчуванням | Установіть production для розгортання |
BASE_URL |
http://localhost:20128 |
Внутрішня базова URL-адреса на стороні сервера |
CLOUD_URL |
https://omniroute.dev |
Базова URL-адреса кінцевої точки хмарної синхронізації |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
Секрет HMAC для згенерованих ключів API |
REQUIRE_API_KEY |
false |
Примусово застосувати ключ API носія на /v1/* |
ENABLE_REQUEST_LOGS |
false |
Вмикає журнали запитів/відповідей |
AUTH_COOKIE_SECURE |
false |
Примусово Secure cookie автентифікації (за зворотним проксі HTTPS) |
Повну довідку про змінні середовища див. у README.
📊 Доступні моделі
Переглянути всі доступні моделі
Claude Code (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001
Codex (cx/) — Plus/Pro: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
Gemini CLI (gc/) — БЕЗКОШТОВНО: gc/gemini-3-flash-preview, gc/gemini-2.5-pro
Копілот GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet
GLM (glm/) — $0,6/1 млн.: glm/glm-4.7
MiniMax (minimax/) — $0,2/1 млн.: minimax/MiniMax-M2.1
iFlow (if/) — БЕЗКОШТОВНО: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
Qwen (qw/) — БЕЗКОШТОВНО: qw/qwen3-coder-plus, qw/qwen3-coder-flash
Kiro (kr/) — БЕЗКОШТОВНО: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
DeepSeek (ds/): ds/deepseek-chat, ds/deepseek-reasoner
Groq (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
Містраль (mistral/): mistral/mistral-large-2501, mistral/codestral-2501
Нерозуміння (pplx/): pplx/sonar-pro, pplx/sonar
Разом AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo
Fireworks AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1
Cerebras (cerebras/): cerebras/llama-3.3-70b
Cohere (cohere/): cohere/command-r-plus-08-2024
NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct
🧩 Розширені функції
Спеціальні моделі
Додайте будь-який ідентифікатор моделі до будь-якого постачальника, не чекаючи оновлення програми:
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"
Або скористайтеся інформаційною панеллю: Постачальники → [Постачальник] → Спеціальні моделі.
Виділені маршрути постачальників
Направляйте запити безпосередньо до конкретного постачальника з перевіркою моделі:
POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations
Префікс провайдера додається автоматично, якщо його немає. Невідповідні моделі повертають 400.
Конфігурація мережевого проксі
# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'
Пріоритет: Специфічний ключ → Специфічний комбінований → Специфічний постачальник → Глобальний → Середовище.
API каталогу моделей
curl http://localhost:20128/api/models/catalog
Повертає моделі, згруповані за постачальниками з типами (chat, embedding, image).
Хмарна синхронізація
- Синхронізація постачальників, комбінацій і налаштувань на всіх пристроях
- Автоматична фонова синхронізація з тайм-аутом + швидка відмова
- Віддавайте перевагу серверним
BASE_URL/CLOUD_URLу виробництві
LLM Gateway Intelligence (Phase 9)
- Семантичний кеш — автоматично кешує непотокові відповіді, температура=0 (обхід за допомогою
X-OmniRoute-No-Cache: true) - Request Idempotency — Дедуплікує запити протягом 5 секунд через заголовок
Idempotency-KeyабоX-Request-Id - Відстеження прогресу — підключення до SSE
event: progressчерез заголовокX-OmniRoute-Progress: true
Ігровий майданчик для перекладачів
Доступ через Інформаційна панель → Перекладач. Налагодьте та візуалізуйте, як OmniRoute перекладає запити API між постачальниками.
| Режим | Призначення |
|---|---|
| Дитячий майданчик | Виберіть вихідний/цільовий формати, вставте запит і миттєво перегляньте перекладений результат |
| Тестувальник чату | Надсилайте повідомлення чату через проксі та перевіряйте повний цикл запитів/відповідей |
| Випробувальний стенд | Виконайте пакетні тести для кількох комбінацій форматів, щоб перевірити правильність перекладу |
| Живий монітор | Переглядайте переклади в реальному часі, коли запити проходять через проксі |
Приклади використання:
- Налагодження причин невдачі певної комбінації клієнт/постачальник
- Переконайтеся, що теги мислення, виклики інструментів і системні підказки перекладаються правильно
- Порівняйте відмінності форматів між форматами OpenAI, Claude, Gemini та Responses API
Стратегії маршрутизації
Налаштувати через Інформаційна панель → Налаштування → Маршрутизація.
| Стратегія | Опис |
|---|---|
| Спочатку заповніть | Використовує облікові записи в пріоритетному порядку — основний обліковий запис обробляє всі запити, поки не стане доступним |
| Кругова система | Переглядає всі облікові записи з настроюваним лімітом (за замовчуванням: 3 виклики на обліковий запис) |
| P2C (Power of Two Choices) | Вибирає 2 випадкові облікові записи та направляє до більш здорового — балансує навантаження з усвідомленням здоров’я |
| Випадкове | Випадково вибирає обліковий запис для кожного запиту за допомогою перемішування Фішера-Єйтса |
| Найменш використовуваний | Маршрути до облікового запису з найстарішою міткою часу lastUsedAt, рівномірно розподіляючи трафік |
| Оптимізація вартості | Маршрути до облікового запису з найнижчим значенням пріоритету, оптимізуючи для найнижчих постачальників |
Псевдоніми моделі підстановки
Створіть шаблони символів підстановки, щоб змінити назви моделей:
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-* → Target: gh/gpt-5.1-codex
Символи підстановки підтримують * (будь-які символи) і ? (один символ).
Резервні ланцюги
Визначте глобальні резервні ланцюжки, які застосовуються до всіх запитів:
Chain: production-fallback
1. cc/claude-opus-4-6
2. gh/gpt-5.1-codex
3. glm/glm-4.7
Стійкість і автоматичні вимикачі
Налаштуйте за допомогою Інформаційна панель → Налаштування → Стійкість.
OmniRoute реалізує стійкість на рівні постачальника за допомогою чотирьох компонентів:
-
Профілі постачальників — конфігурація кожного постачальника для:
- Поріг відмови (кількість відмов до відкриття)
- Тривалість відновлення
- Чутливість визначення межі швидкості
- Експоненціальні параметри відставання
-
Обмеження швидкості, які можна редагувати — параметри системного рівня, які можна налаштувати на інформаційній панелі:
- Запитів за хвилину (RPM) — максимальна кількість запитів за хвилину на обліковий запис
- Мінімальний час між запитами — мінімальний проміжок у мілісекундах між запитами
- Max Concurrent Requests — максимальна кількість одночасних запитів на обліковий запис
- Натисніть Редагувати, щоб змінити, потім Зберегти або Скасувати. Значення зберігаються через API стійкості.
-
Circuit Breaker — відстежує збої кожного постачальника та автоматично розмикає ланцюг, коли досягається порогове значення:
- ЗАКРИТО (справний) — запити надходять нормально
- OPEN — Провайдер тимчасово заблоковано після повторних збоїв
- HALF_OPEN — Перевірка, якщо провайдер відновився
-
Політики та заблоковані ідентифікатори — показує статус автоматичного вимикача та заблоковані ідентифікатори з можливістю примусового розблокування.
-
Автовизначення ліміту швидкості — відстежує заголовки
429таRetry-After, щоб завчасно уникнути перевищення лімітів швидкості постачальника.
Порада: Використовуйте кнопку Скинути все, щоб очистити всі автоматичні вимикачі та часи відновлення, коли постачальник відновиться після збою.
Експорт/імпорт бази даних
Керуйте резервними копіями бази даних у Інформаційна панель → Налаштування → Система та сховище.
| Дія | Опис |
|---|---|
| Експорт бази даних | Завантажує поточну базу даних SQLite як файл .sqlite |
| Експортувати все (.tar.gz) | Завантажує повний резервний архів, включаючи: базу даних, налаштування, комбінації, з’єднання провайдера (без облікових даних), метадані ключа API |
| Імпорт бази даних | Завантажте файл .sqlite, щоб замінити поточну базу даних. Автоматично створюється резервна копія перед імпортом |
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
-F "file=@backup.sqlite"
Перевірка імпорту: Імпортований файл перевіряється на цілісність (перевірка прагми SQLite), необхідні таблиці (provider_connections, provider_nodes, combos, api_keys) і розмір (макс. 100 МБ).
Випадки використання:
- Перенесення OmniRoute між машинами
- Створення зовнішніх резервних копій для аварійного відновлення
- Спільний доступ до конфігурацій між членами команди (експортувати все → надати доступ до архіву)
Інформаційна панель налаштувань
Для зручності навігації сторінка налаштувань складається з 5 вкладок:
| Вкладка | Зміст |
|---|---|
| Безпека | Налаштування логіна/пароля, контроль IP-доступу, авторизація API для /models та блокування постачальника |
| Маршрутизація | Глобальна стратегія маршрутизації (6 варіантів), псевдоніми моделей із підстановкою, резервні ланцюжки, комбіновані параметри за замовчуванням |
| Стійкість | Профілі постачальників, обмеження швидкості, які можна редагувати, статус автоматичного вимикача, політики та заблоковані ідентифікатори |
| AI | Продумана конфігурація бюджету, впровадження глобальної системної підказки, швидка статистика кешу |
| Розширений | Глобальна конфігурація проксі (HTTP/SOCKS5) |
Управління витратами та бюджетом
Доступ через Інформаційна панель → Витрати.
| Вкладка | Призначення |
|---|---|
| Бюджет | Встановіть ліміти витрат на ключ API за допомогою щоденних/тижневих/місячних бюджетів і відстеження в реальному часі |
| Ціни | Перегляд і редагування записів моделі ціноутворення — вартість 1 тис. токенів вводу/виводу на постачальника |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budget
Відстеження вартості: кожен запит реєструє використання токенів і розраховує вартість за допомогою таблиці цін. Перегляньте розбивку в Інформаційна панель → Використання за постачальником, моделлю та ключем API.
Транскрипція аудіо
OmniRoute підтримує транскрипцію аудіо через кінцеву точку, сумісну з OpenAI:
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"
Доступні постачальники: Deepgram (deepgram/), AssemblyAI (assemblyai/).
Підтримувані аудіоформати: mp3, wav, m4a, flac, ogg, webm.
Комбіновані стратегії балансування
Налаштуйте балансування за комбо в Інформаційна панель → Комбо → Створити/Редагувати → Стратегія.
| Стратегія | Опис |
|---|---|
| Кругова система | Обертає моделі послідовно |
| Пріоритет | Завжди пробує першу модель; повертається лише в разі помилки |
| Випадкове | Вибирає випадкову модель із комбо для кожного запиту |
| Зважений | Маршрути пропорційно на основі призначеної ваги для моделі |
| Найменш використовуваний | Маршрути до моделі з найменшою кількістю останніх запитів (використовує комбіновані показники) |
| Оптимізовано за витратами | Маршрути до найдешевшої доступної моделі (використовується таблиця цін) |
Глобальні стандартні параметри комбінованих маршрутів можна встановити в Інформаційна панель → Налаштування → Маршрутизація → Стандартні параметри комбінованих маршрутів.
Інформаційна панель здоров'я
Доступ через Інформаційна панель → Здоров’я. Огляд стану системи в реальному часі з 6 картками:
| Картка | Що це показує |
|---|---|
| Стан системи | Час роботи, версія, використання пам’яті, каталог даних |
| Здоров’я постачальника | Стан автоматичного вимикача для кожного постачальника (замкнуто/розімкнуто/напіврозімкнуто) |
| Обмеження швидкості | Обмеження активної швидкості перезарядки на обліковий запис із часом, що залишився |
| Активні блокування | Провайдери, тимчасово заблоковані політикою блокування |
| Кеш підпису | Статистика кешу дедуплікації (активні ключі, частота звернень) |
| Телеметрія затримки | Агрегація затримок p50/p95/p99 для кожного провайдера |
Професійна порада. Сторінка «Здоров’я» автоматично оновлюється кожні 10 секунд. Використовуйте картку автоматичного вимикача, щоб визначити, які постачальники мають проблеми.