mirror of
https://github.com/diegosouzapw/OmniRoute.git
synced 2026-05-04 17:20:28 +00:00
Add translated documentation (API Reference, Guide, README) for 30+ languages under docs/i18n/, including pt-BR, es, fr, de, it, ru, zh-CN, ja, ko, ar, and many others to improve international accessibility.
698 lines
42 KiB
Markdown
698 lines
42 KiB
Markdown
# Руководство пользователя
|
||
|
||
🌐 **Languages:** 🇺🇸 [English](../../USER_GUIDE.md) | 🇧🇷 [Português (Brasil)](../pt-BR/USER_GUIDE.md) | 🇪🇸 [Español](../es/USER_GUIDE.md) | 🇫🇷 [Français](../fr/USER_GUIDE.md) | 🇮🇹 [Italiano](../it/USER_GUIDE.md) | 🇷🇺 [Русский](../ru/USER_GUIDE.md) | 🇨🇳 [中文 (简体)](../zh-CN/USER_GUIDE.md) | 🇩🇪 [Deutsch](../de/USER_GUIDE.md) | 🇮🇳 [हिन्दी](../in/USER_GUIDE.md) | 🇹🇭 [ไทย](../th/USER_GUIDE.md) | 🇺🇦 [Українська](../uk-UA/USER_GUIDE.md) | 🇸🇦 [العربية](../ar/USER_GUIDE.md) | 🇯🇵 [日本語](../ja/USER_GUIDE.md) | 🇻🇳 [Tiếng Việt](../vi/USER_GUIDE.md) | 🇧🇬 [Български](../bg/USER_GUIDE.md) | 🇩🇰 [Dansk](../da/USER_GUIDE.md) | 🇫🇮 [Suomi](../fi/USER_GUIDE.md) | 🇮🇱 [עברית](../he/USER_GUIDE.md) | 🇭🇺 [Magyar](../hu/USER_GUIDE.md) | 🇮🇩 [Bahasa Indonesia](../id/USER_GUIDE.md) | 🇰🇷 [한국어](../ko/USER_GUIDE.md) | 🇲🇾 [Bahasa Melayu](../ms/USER_GUIDE.md) | 🇳🇱 [Nederlands](../nl/USER_GUIDE.md) | 🇳🇴 [Norsk](../no/USER_GUIDE.md) | 🇵🇹 [Português (Portugal)](../pt/USER_GUIDE.md) | 🇷🇴 [Română](../ro/USER_GUIDE.md) | 🇵🇱 [Polski](../pl/USER_GUIDE.md) | 🇸🇰 [Slovenčina](../sk/USER_GUIDE.md) | 🇸🇪 [Svenska](../sv/USER_GUIDE.md) | 🇵🇭 [Filipino](../phi/USER_GUIDE.md)
|
||
|
||
Полное руководство по настройке поставщиков, созданию комбинаций, интеграции инструментов CLI и развертыванию OmniRoute.
|
||
|
||
---
|
||
|
||
## Содержание
|
||
|
||
- [Pricing at a Glance](#-pricing-at-a-glance)
|
||
- [Use Cases](#-use-cases)
|
||
- [Provider Setup](#-provider-setup)
|
||
- [CLI Integration](#-cli-integration)
|
||
- [Deployment](#-deployment)
|
||
- [Available Models](#-available-models)
|
||
- [Advanced Features](#-advanced-features)
|
||
|
||
---
|
||
|
||
## 💰 Краткий обзор цен
|
||
|
||
| Уровень | Провайдер | Стоимость | Сброс квоты | Лучшее для |
|
||
| ---------------- | ------------------- | ------------------------------ | ---------------------------- | -------------------------------- |
|
||
| **💳 ПОДПИСКА** | Клод Код (Про) | 20 долларов США в месяц | 5 часов + еженедельно | Уже подписан |
|
||
| | Кодекс (Плюс/Про) | 20–200 долларов в месяц | 5 часов + еженедельно | Пользователи OpenAI |
|
||
| | Близнецы CLI | **БЕСПЛАТНО** | 180 тыс./мес + 1 тыс./день | Каждый! |
|
||
| | Второй пилот GitHub | 10–19 долларов в месяц | Ежемесячно | Пользователи GitHub |
|
||
| **🔑 КЛЮЧ API** | ДипСик | Плата за использование | Нет | Дешевое рассуждение |
|
||
| | Грок | Плата за использование | Нет | Сверхбыстрый вывод |
|
||
| | xAI (Грок) | Плата за использование | Нет | рассуждения Грока 4 |
|
||
| | Мистраль | Плата за использование | Нет | Модели, размещенные в ЕС |
|
||
| | Растерянность | Плата за использование | Нет | Расширенный поиск |
|
||
| | Вместе ИИ | Плата за использование | Нет | Модели с открытым исходным кодом |
|
||
| | Фейерверк ИИ | Плата за использование | Нет | Изображения Fast FLUX |
|
||
| | Церебра | Плата за использование | Нет | Скорость пластинчатого масштаба |
|
||
| | Согласовано | Плата за использование | Нет | Команда R+ ТРЯПКА |
|
||
| | NVIDIA НИМ | Плата за использование | Нет | Модели предприятия |
|
||
| **💰 ДЕШЕВО** | ГЛМ-4.7 | 0,6 долл. США/1 млн | Ежедневно в 10:00 | Резервное копирование бюджета |
|
||
| | МиниМакс М2.1 | 0,2 долл. США/1 млн | 5-часовой прокат | Самый дешевый вариант |
|
||
| | Кими К2 | 9 долларов в месяц за квартиру | 10 миллионов токенов в месяц | Предсказуемая стоимость |
|
||
| **🆓 БЕСПЛАТНО** | iFlow | $0 | Неограниченный | 8 моделей бесплатно |
|
||
| | Квен | $0 | Неограниченный | 3 модели бесплатно |
|
||
| | Киро | $0 | Неограниченный | Клод бесплатно |
|
||
|
||
**💡Совет для профессионалов:** Начните с комбинации Gemini CLI (180 000 бесплатно в месяц) + iFlow (бесплатно без ограничений) = стоимость 0 долларов США!
|
||
|
||
---
|
||
|
||
## 🎯 Варианты использования
|
||
|
||
### Случай 1: «У меня подписка Claude Pro»
|
||
|
||
**Проблема:** Срок действия квоты истекает, если она не используется, ограничения скорости во время интенсивного кодирования.
|
||
|
||
```
|
||
Combo: "maximize-claude"
|
||
1. cc/claude-opus-4-6 (use subscription fully)
|
||
2. glm/glm-4.7 (cheap backup when quota out)
|
||
3. if/kimi-k2-thinking (free emergency fallback)
|
||
|
||
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
|
||
vs. $20 + hitting limits = frustration
|
||
```
|
||
|
||
### Случай 2: «Я хочу нулевую стоимость»
|
||
|
||
**Проблема:** Не могу позволить себе подписку, нужно надежное кодирование с использованием искусственного интеллекта.
|
||
|
||
```
|
||
Combo: "free-forever"
|
||
1. gc/gemini-3-flash (180K free/month)
|
||
2. if/kimi-k2-thinking (unlimited free)
|
||
3. qw/qwen3-coder-plus (unlimited free)
|
||
|
||
Monthly cost: $0
|
||
Quality: Production-ready models
|
||
```
|
||
|
||
### Случай 3: «Мне нужно кодирование 24/7, без перерывов»
|
||
|
||
**Проблема:** сроки, невозможность простоя
|
||
|
||
```
|
||
Combo: "always-on"
|
||
1. cc/claude-opus-4-6 (best quality)
|
||
2. cx/gpt-5.2-codex (second subscription)
|
||
3. glm/glm-4.7 (cheap, resets daily)
|
||
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
|
||
5. if/kimi-k2-thinking (free unlimited)
|
||
|
||
Result: 5 layers of fallback = zero downtime
|
||
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
|
||
```
|
||
|
||
### Случай 4: «Мне нужен БЕСПЛАТНЫЙ ИИ в OpenClaw»
|
||
|
||
**Проблема:** Нужен ИИ-помощник в приложениях для обмена сообщениями, совершенно бесплатно.
|
||
|
||
```
|
||
Combo: "openclaw-free"
|
||
1. if/glm-4.7 (unlimited free)
|
||
2. if/minimax-m2.1 (unlimited free)
|
||
3. if/kimi-k2-thinking (unlimited free)
|
||
|
||
Monthly cost: $0
|
||
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
|
||
```
|
||
|
||
---
|
||
|
||
## 📖 Настройка провайдера
|
||
|
||
### 🔐 Поставщики подписки
|
||
|
||
#### Клод Код (Про/Макс)
|
||
|
||
```bash
|
||
Dashboard → Providers → Connect Claude Code
|
||
→ OAuth login → Auto token refresh
|
||
→ 5-hour + weekly quota tracking
|
||
|
||
Models:
|
||
cc/claude-opus-4-6
|
||
cc/claude-sonnet-4-5-20250929
|
||
cc/claude-haiku-4-5-20251001
|
||
```
|
||
|
||
**Совет для профессионалов.** Используйте Opus для сложных задач и Sonnet для скорости. OmniRoute отслеживает квоту на каждую модель!
|
||
|
||
#### Кодекс OpenAI (Плюс/Про)
|
||
|
||
```bash
|
||
Dashboard → Providers → Connect Codex
|
||
→ OAuth login (port 1455)
|
||
→ 5-hour + weekly reset
|
||
|
||
Models:
|
||
cx/gpt-5.2-codex
|
||
cx/gpt-5.1-codex-max
|
||
```
|
||
|
||
#### Gemini CLI (180 000 БЕСПЛАТНО в месяц!)
|
||
|
||
```bash
|
||
Dashboard → Providers → Connect Gemini CLI
|
||
→ Google OAuth
|
||
→ 180K completions/month + 1K/day
|
||
|
||
Models:
|
||
gc/gemini-3-flash-preview
|
||
gc/gemini-2.5-pro
|
||
```
|
||
|
||
**Лучшая цена:** Огромный уровень бесплатного пользования! Используйте это перед платными уровнями.
|
||
|
||
#### Второй пилот GitHub
|
||
|
||
```bash
|
||
Dashboard → Providers → Connect GitHub
|
||
→ OAuth via GitHub
|
||
→ Monthly reset (1st of month)
|
||
|
||
Models:
|
||
gh/gpt-5
|
||
gh/claude-4.5-sonnet
|
||
gh/gemini-3-pro
|
||
```
|
||
|
||
### 💰 Дешевые провайдеры
|
||
|
||
#### GLM-4.7 (ежедневный сброс, $0,6/1 миллион)
|
||
|
||
1. Зарегистрируйтесь: [Zhipu AI](https://open.bigmodel.cn/)
|
||
2. Получите ключ API из плана кодирования.
|
||
3. Панель управления → Добавить ключ API: Поставщик: `glm`, Ключ API: `your-key`.
|
||
|
||
**Используйте:** `glm/glm-4.7` — **Совет для профессионалов:** План кодирования предлагает 3-кратную квоту за 1/7 стоимости! Сброс ежедневно в 10:00.
|
||
|
||
#### MiniMax M2.1 (5 часов сброса, 0,20 доллара США/1 миллион долларов США)
|
||
|
||
1. Зарегистрируйтесь: [MiniMax](https://www.minimax.io/)
|
||
2. Получите ключ API → Панель управления → Добавить ключ API.
|
||
|
||
**Используйте:** `minimax/MiniMax-M2.1` — **Совет для профессионалов:** Самый дешевый вариант для длинного контекста (1 млн токенов)!
|
||
|
||
#### Кими К2 (фиксированная цена 9 долларов в месяц)
|
||
|
||
1. Подпишитесь: [Moonshot AI](https://platform.moonshot.ai/)
|
||
2. Получите ключ API → Панель управления → Добавить ключ API.
|
||
|
||
**Используйте:** `kimi/kimi-latest` — **Совет для профессионалов:** Фиксированная 9 долларов США в месяц за 10 миллионов токенов = эффективная стоимость 0,90 долларов США/1 миллион долларов США!
|
||
|
||
### 🆓 БЕСПЛАТНЫЕ провайдеры
|
||
|
||
#### iFlow (8 БЕСПЛАТНЫХ моделей)
|
||
|
||
```bash
|
||
Dashboard → Connect iFlow → OAuth login → Unlimited usage
|
||
|
||
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1
|
||
```
|
||
|
||
#### Квен (3 БЕСПЛАТНЫЕ модели)
|
||
|
||
```bash
|
||
Dashboard → Connect Qwen → Device code auth → Unlimited usage
|
||
|
||
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash
|
||
```
|
||
|
||
#### Киро (Клод ФРИ)
|
||
|
||
```bash
|
||
Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
|
||
|
||
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
|
||
```
|
||
|
||
---
|
||
|
||
## 🎨 Комбо
|
||
|
||
### Пример 1: увеличить подписку → дешевое резервное копирование
|
||
|
||
```
|
||
Dashboard → Combos → Create New
|
||
|
||
Name: premium-coding
|
||
Models:
|
||
1. cc/claude-opus-4-6 (Subscription primary)
|
||
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
|
||
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
|
||
|
||
Use in CLI: premium-coding
|
||
```
|
||
|
||
### Пример 2: только бесплатно (нулевая стоимость)
|
||
|
||
```
|
||
Name: free-combo
|
||
Models:
|
||
1. gc/gemini-3-flash-preview (180K free/month)
|
||
2. if/kimi-k2-thinking (unlimited)
|
||
3. qw/qwen3-coder-plus (unlimited)
|
||
|
||
Cost: $0 forever!
|
||
```
|
||
|
||
---
|
||
|
||
## 🔧 Интеграция CLI
|
||
|
||
### Курсор IDE
|
||
|
||
```
|
||
Settings → Models → Advanced:
|
||
OpenAI API Base URL: http://localhost:20128/v1
|
||
OpenAI API Key: [from omniroute dashboard]
|
||
Model: cc/claude-opus-4-6
|
||
```
|
||
|
||
### Клод Код
|
||
|
||
Отредактируйте `~/.claude/config.json`:
|
||
|
||
```json
|
||
{
|
||
"anthropic_api_base": "http://localhost:20128/v1",
|
||
"anthropic_api_key": "your-omniroute-api-key"
|
||
}
|
||
```
|
||
|
||
### Интерфейс командной строки Кодекса
|
||
|
||
```bash
|
||
export OPENAI_BASE_URL="http://localhost:20128"
|
||
export OPENAI_API_KEY="your-omniroute-api-key"
|
||
codex "your prompt"
|
||
```
|
||
|
||
### OpenClaw
|
||
|
||
Отредактируйте `~/.openclaw/openclaw.json`:
|
||
|
||
```json
|
||
{
|
||
"agents": {
|
||
"defaults": {
|
||
"model": { "primary": "omniroute/if/glm-4.7" }
|
||
}
|
||
},
|
||
"models": {
|
||
"providers": {
|
||
"omniroute": {
|
||
"baseUrl": "http://localhost:20128/v1",
|
||
"apiKey": "your-omniroute-api-key",
|
||
"api": "openai-completions",
|
||
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
|
||
}
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
**Или используйте панель инструментов:** Инструменты CLI → OpenClaw → Автонастройка.
|
||
|
||
### Клайн / Продолжить / RooCode
|
||
|
||
```
|
||
Provider: OpenAI Compatible
|
||
Base URL: http://localhost:20128/v1
|
||
API Key: [from dashboard]
|
||
Model: cc/claude-opus-4-6
|
||
```
|
||
|
||
---
|
||
|
||
## 🚀 Развертывание
|
||
|
||
### Развертывание VPS
|
||
|
||
```bash
|
||
git clone https://github.com/diegosouzapw/OmniRoute.git
|
||
cd OmniRoute && npm install && npm run build
|
||
|
||
export JWT_SECRET="your-secure-secret-change-this"
|
||
export INITIAL_PASSWORD="your-password"
|
||
export DATA_DIR="/var/lib/omniroute"
|
||
export PORT="20128"
|
||
export HOSTNAME="0.0.0.0"
|
||
export NODE_ENV="production"
|
||
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
|
||
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
|
||
|
||
npm run start
|
||
# Or: pm2 start npm --name omniroute -- start
|
||
```
|
||
|
||
### Докер
|
||
|
||
```bash
|
||
# Build image (default = runner-cli with codex/claude/droid preinstalled)
|
||
docker build -t omniroute:cli .
|
||
|
||
# Portable mode (recommended)
|
||
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli
|
||
```
|
||
|
||
Для режима интеграции с хостом с двоичными файлами CLI см. раздел Docker в основной документации.
|
||
|
||
### Переменные среды
|
||
|
||
| Переменная | По умолчанию | Описание |
|
||
| --------------------- | ------------------------------------ | -------------------------------------------------------------------------------------------------- |
|
||
| `JWT_SECRET` | `omniroute-default-secret-change-me` | Секрет подписания JWT (**изменение в производстве**) |
|
||
| `INITIAL_PASSWORD` | `123456` | Первый пароль для входа |
|
||
| `DATA_DIR` | `~/.omniroute` | Каталог данных (база данных, использование, журналы) |
|
||
| `PORT` | структура по умолчанию | Сервисный порт (`20128` в примерах) |
|
||
| `HOSTNAME` | структура по умолчанию | Привязать хост (по умолчанию в Docker используется `0.0.0.0`) |
|
||
| `NODE_ENV` | по умолчанию во время выполнения | Установите `production` для развертывания |
|
||
| `BASE_URL` | `http://localhost:20128` | Внутренний базовый URL-адрес на стороне сервера |
|
||
| `CLOUD_URL` | `https://omniroute.dev` | Базовый URL-адрес конечной точки облачной синхронизации |
|
||
| `API_KEY_SECRET` | `endpoint-proxy-api-key-secret` | Секрет HMAC для сгенерированных ключей API |
|
||
| `REQUIRE_API_KEY` | `false` | Принудительно использовать ключ API носителя на `/v1/*` |
|
||
| `ENABLE_REQUEST_LOGS` | `false` | Включает журналы запросов/ответов |
|
||
| `AUTH_COOKIE_SECURE` | `false` | Принудительно использовать файл cookie аутентификации `Secure` (за обратным прокси-сервером HTTPS) |
|
||
|
||
Полную ссылку на переменную среды см. в [README](../README.md).
|
||
|
||
---
|
||
|
||
## 📊 Доступные модели
|
||
|
||
<details>
|
||
<summary><b>Просмотреть все доступные модели</b></summary>
|
||
|
||
**Код Клауда (`cc/`)** — Pro/Max: `cc/claude-opus-4-6`, `cc/claude-sonnet-4-5-20250929`, `cc/claude-haiku-4-5-20251001`
|
||
|
||
**Кодекс (`cx/`)** — Plus/Pro: `cx/gpt-5.2-codex`, `cx/gpt-5.1-codex-max`
|
||
|
||
**Gemini CLI (`gc/`)** — БЕСПЛАТНО: `gc/gemini-3-flash-preview`, `gc/gemini-2.5-pro`
|
||
|
||
**Второй пилот GitHub (`gh/`)**: `gh/gpt-5`, `gh/claude-4.5-sonnet`
|
||
|
||
**GLM (`glm/`)** — 0,6 долларов США/1 миллион долларов США: `glm/glm-4.7`
|
||
|
||
**MiniMax (`minimax/`)** — 0,2 доллара США/1 миллион долларов: `minimax/MiniMax-M2.1`
|
||
|
||
**iFlow (`if/`)** — БЕСПЛАТНО: `if/kimi-k2-thinking`, `if/qwen3-coder-plus`, `if/deepseek-r1`
|
||
|
||
**Квен (`qw/`)** — БЕСПЛАТНО: `qw/qwen3-coder-plus`, `qw/qwen3-coder-flash`
|
||
|
||
**Киро (`kr/`)** — БЕСПЛАТНО: `kr/claude-sonnet-4.5`, `kr/claude-haiku-4.5`
|
||
|
||
**DeepSeek (`ds/`)**: `ds/deepseek-chat`, `ds/deepseek-reasoner`
|
||
|
||
**Грок (`groq/`)**: `groq/llama-3.3-70b-versatile`, `groq/llama-4-maverick-17b-128e-instruct`
|
||
|
||
**xAI (`xai/`)**: `xai/grok-4`, `xai/grok-4-0709-fast-reasoning`, `xai/grok-code-mini`
|
||
|
||
**Мистраль (`mistral/`)**: `mistral/mistral-large-2501`, `mistral/codestral-2501`
|
||
|
||
**Недоумение (`pplx/`)**: `pplx/sonar-pro`, `pplx/sonar`
|
||
|
||
**Вместе ИИ (`together/`)**: `together/meta-llama/Llama-3.3-70B-Instruct-Turbo`
|
||
|
||
**ИИ фейерверков (`fireworks/`)**: `fireworks/accounts/fireworks/models/deepseek-v3p1`
|
||
|
||
**Церебра (`cerebras/`)**: `cerebras/llama-3.3-70b`
|
||
|
||
**Согласовано (`cohere/`)**: `cohere/command-r-plus-08-2024`
|
||
|
||
**NVIDIA NIM (`nvidia/`)**: `nvidia/nvidia/llama-3.3-70b-instruct`
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🧩 Расширенные функции
|
||
|
||
### Пользовательские модели
|
||
|
||
Добавьте любой идентификатор модели к любому поставщику, не дожидаясь обновления приложения:
|
||
|
||
```bash
|
||
# Via API
|
||
curl -X POST http://localhost:20128/api/provider-models \
|
||
-H "Content-Type: application/json" \
|
||
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
|
||
|
||
# List: curl http://localhost:20128/api/provider-models?provider=openai
|
||
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"
|
||
```
|
||
|
||
Или используйте панель управления: **Поставщики → [Поставщик] → Пользовательские модели**.
|
||
|
||
### Маршруты выделенного провайдера
|
||
|
||
Направляйте запросы непосредственно к конкретному поставщику с проверкой модели:
|
||
|
||
```bash
|
||
POST http://localhost:20128/v1/providers/openai/chat/completions
|
||
POST http://localhost:20128/v1/providers/openai/embeddings
|
||
POST http://localhost:20128/v1/providers/fireworks/images/generations
|
||
```
|
||
|
||
Префикс провайдера добавляется автоматически, если он отсутствует. Несовпадающие модели возвращают `400`.
|
||
|
||
### Конфигурация сетевого прокси
|
||
|
||
```bash
|
||
# Set global proxy
|
||
curl -X PUT http://localhost:20128/api/settings/proxy \
|
||
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
|
||
|
||
# Per-provider proxy
|
||
curl -X PUT http://localhost:20128/api/settings/proxy \
|
||
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
|
||
|
||
# Test proxy
|
||
curl -X POST http://localhost:20128/api/settings/proxy/test \
|
||
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'
|
||
```
|
||
|
||
**Приоритет:** Зависит от ключа → Зависит от комбинации → Зависит от поставщика → Глобальный → Среда.
|
||
|
||
### API каталога моделей
|
||
|
||
```bash
|
||
curl http://localhost:20128/api/models/catalog
|
||
```
|
||
|
||
Возвращает модели, сгруппированные по поставщикам с типами (`chat`, `embedding`, `image`).
|
||
|
||
### Облачная синхронизация
|
||
|
||
- Синхронизация поставщиков, комбинаций и настроек между устройствами.
|
||
- Автоматическая фоновая синхронизация с таймаутом + отказоустойчивость
|
||
- Предпочитайте серверную часть `BASE_URL`/`CLOUD_URL` в рабочей среде.
|
||
|
||
### LLM Gateway Intelligence (этап 9)
|
||
|
||
- **Семантический кеш** — автоматически кэширует непоточные ответы с температурой = 0 (обход с помощью `X-OmniRoute-No-Cache: true`)
|
||
- **Идемпотентность запросов** — дедупликация запросов в течение 5 секунд через заголовок `Idempotency-Key` или `X-Request-Id`.
|
||
- **Отслеживание прогресса** — включите события SSE `event: progress` через заголовок `X-OmniRoute-Progress: true`.
|
||
|
||
---
|
||
|
||
### Игровая площадка переводчика
|
||
|
||
Доступ через **Личный кабинет → Переводчик**. Отладка и визуализация того, как OmniRoute преобразует запросы API между поставщиками.
|
||
|
||
| Режим | Цель |
|
||
| ----------------------- | -------------------------------------------------------------------------------------------------- |
|
||
| **Детская площадка** | Выберите исходный/целевой формат, вставьте запрос и мгновенно просмотрите переведенный результат |
|
||
| **Тестер чата** | Отправляйте сообщения в чате через прокси и проверяйте полный цикл запросов/ответов |
|
||
| **Испытательный стенд** | Запустите пакетные тесты для нескольких комбинаций форматов, чтобы проверить правильность перевода |
|
||
| **Живой монитор** | Наблюдайте за переводами в реальном времени, пока запросы проходят через прокси |
|
||
|
||
**Случаи использования:**
|
||
|
||
- Отладка причины сбоя конкретной комбинации клиента/провайдера.
|
||
- Убедитесь, что теги мышления, вызовы инструментов и системные подсказки переводятся правильно.
|
||
- Сравните различия форматов между форматами API OpenAI, Claude, Gemini и Responses.
|
||
|
||
---
|
||
|
||
### Стратегии маршрутизации
|
||
|
||
Настройте через **Панель управления → Настройки → Маршрутизация**.
|
||
|
||
| Стратегия | Описание |
|
||
| ----------------------------- | -------------------------------------------------------------------------------------------------------------------------------- |
|
||
| **Сначала заполните** | Использует учетные записи в порядке приоритета — основная учетная запись обрабатывает все запросы, пока они не станут недоступны |
|
||
| **Круговая система** | Циклически перебирает все учетные записи с настраиваемым фиксированным лимитом (по умолчанию: 3 вызова на учетную запись) |
|
||
| **P2C (Сила двух вариантов)** | Выбирает 2 случайных аккаунта и направляется к более здоровому — балансирует нагрузку с осознанием здоровья |
|
||
| **Случайный** | Случайным образом выбирает учетную запись для каждого запроса, используя перемешивание Фишера-Йейтса |
|
||
| **Наименее используемый** | Маршруты к аккаунту с самой старой меткой времени `lastUsedAt`, трафик распределяется равномерно |
|
||
| **Оптимизирована стоимость** | Маршруты к учетной записи с наименьшим значением приоритета, оптимизация для поставщиков с наименьшими затратами |
|
||
|
||
#### Псевдонимы модели с подстановочными знаками
|
||
|
||
Создайте шаблоны подстановочных знаков для переназначения имен моделей:
|
||
|
||
```
|
||
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
|
||
Pattern: gpt-* → Target: gh/gpt-5.1-codex
|
||
```
|
||
|
||
Подстановочные знаки поддерживают `*` (любые символы) и `?` (один символ).
|
||
|
||
#### Резервные цепочки
|
||
|
||
Определите глобальные резервные цепочки, которые применяются ко всем запросам:
|
||
|
||
```
|
||
Chain: production-fallback
|
||
1. cc/claude-opus-4-6
|
||
2. gh/gpt-5.1-codex
|
||
3. glm/glm-4.7
|
||
```
|
||
|
||
---
|
||
|
||
### Устойчивость и автоматические выключатели
|
||
|
||
Настройте через **Панель управления → Настройки → Устойчивость**.
|
||
|
||
OmniRoute реализует устойчивость на уровне поставщика с помощью четырех компонентов:
|
||
|
||
1. **Профили поставщиков** — конфигурация каждого поставщика для:
|
||
- Порог отказа (сколько отказов до открытия)
|
||
- Продолжительность перезарядки
|
||
- Чувствительность определения ограничения скорости
|
||
- Параметры экспоненциальной отсрочки
|
||
|
||
2. **Редактируемые ограничения скорости** — настройки по умолчанию на уровне системы, которые можно настроить на панели управления:
|
||
- **Запросов в минуту (RPM)** — максимальное количество запросов в минуту на аккаунт.
|
||
- **Min Time Between Requests** — Минимальный промежуток в миллисекундах между запросами.
|
||
- **Максимальное количество одновременных запросов** — максимальное количество одновременных запросов на одну учетную запись.
|
||
– Нажмите **Изменить**, чтобы изменить, затем **Сохранить** или **Отменить**. Значения сохраняются через API устойчивости.
|
||
|
||
3. **Прерыватель цепи** — отслеживает сбои каждого провайдера и автоматически размыкает цепь при достижении порогового значения:
|
||
- **ЗАКРЫТО** (Исправно) — запросы выполняются нормально.
|
||
- **OPEN** — Провайдер временно заблокирован после повторных сбоев.
|
||
- **HALF_OPEN** — Проверка восстановления провайдера
|
||
|
||
4. **Политики и заблокированные идентификаторы** — отображает состояние автоматического выключателя и заблокированные идентификаторы с возможностью принудительной разблокировки.
|
||
|
||
5. **Автоматическое определение ограничения скорости** — отслеживает заголовки `429` и `Retry-After`, чтобы заранее избежать превышения ограничений скорости провайдера.
|
||
|
||
**Совет для профессионалов.** Используйте кнопку **Сбросить все**, чтобы сбросить все автоматические выключатели и время восстановления, когда поставщик услуг восстанавливается после сбоя.
|
||
|
||
---
|
||
|
||
### Экспорт/импорт базы данных
|
||
|
||
Управляйте резервными копиями базы данных в **Панель управления → Настройки → Система и хранилище**.
|
||
|
||
| Действие | Описание |
|
||
| -------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------- |
|
||
| **Экспорт базы данных** | Загружает текущую базу данных SQLite в виде файла `.sqlite` |
|
||
| **Экспортировать все (.tar.gz)** | Загружает полный архив резервных копий, включая: базу данных, настройки, комбинации, подключения к провайдерам (без учетных данных), метаданные ключей API |
|
||
| **Импорт базы данных** | Загрузите файл `.sqlite`, чтобы заменить текущую базу данных. Резервная копия перед импортом создается автоматически |
|
||
|
||
```bash
|
||
# API: Export database
|
||
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
|
||
|
||
# API: Export all (full archive)
|
||
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
|
||
|
||
# API: Import database
|
||
curl -X POST http://localhost:20128/api/db-backups/import \
|
||
-F "file=@backup.sqlite"
|
||
```
|
||
|
||
**Проверка импорта.** Импортируемый файл проверяется на целостность (проверка прагмы SQLite), необходимые таблицы (`provider_connections`, `provider_nodes`, `combos`, `api_keys`) и размер (максимум 100 МБ).
|
||
|
||
**Примеры использования:**
|
||
|
||
- Миграция OmniRoute между компьютерами
|
||
- Создание внешних резервных копий для аварийного восстановления.
|
||
- Делитесь конфигурациями между членами команды (экспортировать все → поделиться архивом)
|
||
|
||
---
|
||
|
||
### Панель настроек
|
||
|
||
Страница настроек разделена на 5 вкладок для удобной навигации:
|
||
|
||
| Вкладка | Содержание |
|
||
| ----------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------- |
|
||
| **Безопасность** | Настройки логина/пароля, контроль доступа по IP, аутентификация API для `/models` и блокировка провайдера |
|
||
| **Маршрутизация** | Глобальная стратегия маршрутизации (6 вариантов), псевдонимы моделей с подстановочными знаками, резервные цепочки, комбинированные значения по умолчанию |
|
||
| **Устойчивость** | Профили провайдеров, редактируемые ограничения скорости, статус автоматического выключателя, политики и заблокированные идентификаторы |
|
||
| **ИИ** | Обдумывание конфигурации бюджета, глобальная системная инъекция подсказок, статистика кэша подсказок |
|
||
| **Расширенный** | Глобальная конфигурация прокси (HTTP/SOCKS5) |
|
||
|
||
---
|
||
|
||
### Управление затратами и бюджетом
|
||
|
||
Доступ через **Личный кабинет → Расходы**.
|
||
|
||
| Вкладка | Цель |
|
||
| ---------- | ------------------------------------------------------------------------------------------------------------------------- |
|
||
| **Бюджет** | Установите лимиты расходов на ключ API с ежедневными/еженедельными/месячными бюджетами и отслеживанием в реальном времени |
|
||
| **Цены** | Просмотр и редактирование записей цен модели — стоимость за 1 тыс. токенов ввода/вывода на одного поставщика |
|
||
|
||
```bash
|
||
# API: Set a budget
|
||
curl -X POST http://localhost:20128/api/usage/budget \
|
||
-H "Content-Type: application/json" \
|
||
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
|
||
|
||
# API: Get current budget status
|
||
curl http://localhost:20128/api/usage/budget
|
||
```
|
||
|
||
**Отслеживание затрат.** Каждый запрос регистрирует использование токенов и рассчитывает стоимость с использованием таблицы цен. Просмотрите разбивку в **Панель управления → Использование** по поставщикам, моделям и ключам API.
|
||
|
||
---
|
||
|
||
### Аудио транскрипция
|
||
|
||
OmniRoute поддерживает транскрипцию звука через конечную точку, совместимую с OpenAI:
|
||
|
||
```bash
|
||
POST /v1/audio/transcriptions
|
||
Authorization: Bearer your-api-key
|
||
Content-Type: multipart/form-data
|
||
|
||
# Example with curl
|
||
curl -X POST http://localhost:20128/v1/audio/transcriptions \
|
||
-H "Authorization: Bearer your-api-key" \
|
||
-F "file=@audio.mp3" \
|
||
-F "model=deepgram/nova-3"
|
||
```
|
||
|
||
Доступные поставщики: **Deepgram** (`deepgram/`), **AssemblyAI** (`assemblyai/`).
|
||
|
||
Поддерживаемые аудиоформаты: `mp3`, `wav`, `m4a`, `flac`, `ogg`, `webm`.
|
||
|
||
---
|
||
|
||
### Стратегии балансировки комбо
|
||
|
||
Настройте балансировку для каждой комбинации в **Панель управления → Комбинации → Создать/Редактировать → Стратегия**.
|
||
|
||
| Стратегия | Описание |
|
||
| ------------------------------ | ------------------------------------------------------------------------------------------------- |
|
||
| **Круговой** | Последовательное переключение моделей |
|
||
| **Приоритет** | Всегда пробует первую модель; возвращается только в случае ошибки |
|
||
| **Случайный** | Выбирает случайную модель из комбинации для каждого запроса |
|
||
| **Взвешенный** | Маршруты пропорциональны на основе назначенных весов для каждой модели |
|
||
| **Наименее используемый** | Маршруты к модели с наименьшим количеством недавних запросов (использует комбинированные метрики) |
|
||
| **Оптимизированная стоимость** | Маршруты к самой дешевой доступной модели (используется таблица цен) |
|
||
|
||
Глобальные настройки комбо по умолчанию можно установить в **Панель управления → Настройки → Маршрутизация → Параметры комбо по умолчанию**.
|
||
|
||
---
|
||
|
||
### Панель управления здоровьем
|
||
|
||
Доступ через **Панель управления → Здоровье**. Обзор состояния системы в реальном времени с 6 картами:
|
||
|
||
| Карта | Что это показывает |
|
||
| ----------------------------- | -------------------------------------------------------------------------------------- |
|
||
| **Состояние системы** | Время работы, версия, использование памяти, каталог данных |
|
||
| **Здоровье поставщика услуг** | Состояние автоматического выключателя каждого поставщика (Закрыто/Открыто/Полуоткрыто) |
|
||
| **Ограничения ставок** | Время восстановления активного лимита скорости на аккаунт с оставшимся временем |
|
||
| **Активные блокировки** | Провайдеры временно заблокированы политикой блокировки |
|
||
| **Кэш подписей** | Статистика кэша дедупликации (активные ключи, частота попаданий) |
|
||
| **Телеметрия с задержкой** | Агрегация задержек p50/p95/p99 для каждого провайдера |
|
||
|
||
**Совет для профессионалов.** Страница «Здоровье» автоматически обновляется каждые 10 секунд. Используйте карту автоматического выключателя, чтобы определить, у каких поставщиков возникли проблемы.
|