mirror of
https://github.com/diegosouzapw/OmniRoute.git
synced 2026-05-05 09:46:30 +00:00
star-history.com embeds are often cached and slow to update. The new starchart.cc widget (variant=adaptive) renders better on both light and dark themes and updates in real-time. Updated: README.md + 29 i18n locale READMEs
1493 lines
68 KiB
Markdown
1493 lines
68 KiB
Markdown
<div align="center">
|
||
<img src="./docs/screenshots/MainOmniRoute.png" alt="OmniRoute Dashboard" width="800"/>
|
||
|
||
# 🚀 OmniRoute — O Gateway de IA Gratuito
|
||
|
||
### Nunca pare de programar. Roteamento inteligente para **modelos de IA GRATUITOS e baratos** com fallback automático.
|
||
|
||
_Seu proxy de API universal — um endpoint, 36+ provedores, zero tempo de inatividade._
|
||
|
||
**Chat Completions • Embeddings • Geração de Imagem • Vídeo • Música • Áudio • Reranking • 100% TypeScript**
|
||
|
||
---
|
||
|
||
### 🚀 New in v2.0.9+ — Playground, CLI Fingerprints & ACP
|
||
|
||
| Feature | What It Does |
|
||
| ------------------------------------------ | --------------------------------------------------------------------------------------------------------------------------------------------- |
|
||
| 🎮 **Model Playground** | Dashboard page to test any model directly — provider/model/endpoint selectors, Monaco Editor, streaming, abort, timing |
|
||
| 🔏 **CLI Fingerprint Matching** | Per-provider header/body ordering to match native CLI signatures — toggle per provider in Settings > Security. **Your proxy IP is preserved** |
|
||
| 🤝 **ACP Support (Agent Client Protocol)** | CLI agent discovery (Codex, Claude, Goose, Gemini CLI, OpenClaw), process spawner, `/api/acp/agents` endpoint |
|
||
| 🤖 **ACP Agents Dashboard** | Debug > Agents page — grid of 14 agents with install status, version, custom agent form for any CLI tool |
|
||
| 🔧 **Custom Model `apiFormat` Routing** | Custom models with `apiFormat: "responses"` now correctly route to the Responses API translator |
|
||
| 🏢 **Codex Workspace Isolation** | Multiple Codex workspaces per email — OAuth correctly separates connections by workspace ID |
|
||
| 🔄 **Electron Auto-Update** | Desktop app checks for updates + auto-install on restart |
|
||
|
||
### 🤖 Provedor de IA Gratuito para seus agentes de programação favoritos
|
||
|
||
_Conecte qualquer IDE ou ferramenta CLI com IA através do OmniRoute — gateway de API gratuito para programação ilimitada._
|
||
|
||
<table>
|
||
<tr>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/cline/cline">
|
||
<img src="./public/providers/openclaw.png" alt="OpenClaw" width="48"/><br/>
|
||
<b>OpenClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 205K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/HKUDS/nanobot">
|
||
<img src="./public/providers/nanobot.png" alt="NanoBot" width="48"/><br/>
|
||
<b>NanoBot</b>
|
||
</a><br/>
|
||
<sub>⭐ 20.9K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/sipeed/picoclaw">
|
||
<img src="./public/providers/picoclaw.jpg" alt="PicoClaw" width="48"/><br/>
|
||
<b>PicoClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 14.6K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/zeroclaw-labs/zeroclaw">
|
||
<img src="./public/providers/zeroclaw.png" alt="ZeroClaw" width="48"/><br/>
|
||
<b>ZeroClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 9.9K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/nearai/ironclaw">
|
||
<img src="./public/providers/ironclaw.png" alt="IronClaw" width="48"/><br/>
|
||
<b>IronClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 2.1K</sub>
|
||
</td>
|
||
</tr>
|
||
<tr>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/anomalyco/opencode">
|
||
<img src="./public/providers/opencode.svg" alt="OpenCode" width="48"/><br/>
|
||
<b>OpenCode</b>
|
||
</a><br/>
|
||
<sub>⭐ 106K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/openai/codex">
|
||
<img src="./public/providers/codex.png" alt="Codex CLI" width="48"/><br/>
|
||
<b>Codex CLI</b>
|
||
</a><br/>
|
||
<sub>⭐ 60.8K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/anthropics/claude-code">
|
||
<img src="./public/providers/claude.png" alt="Claude Code" width="48"/><br/>
|
||
<b>Claude Code</b>
|
||
</a><br/>
|
||
<sub>⭐ 67.3K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/google-gemini/gemini-cli">
|
||
<img src="./public/providers/gemini-cli.png" alt="Gemini CLI" width="48"/><br/>
|
||
<b>Gemini CLI</b>
|
||
</a><br/>
|
||
<sub>⭐ 94.7K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/Kilo-Org/kilocode">
|
||
<img src="./public/providers/kilocode.png" alt="Kilo Code" width="48"/><br/>
|
||
<b>Kilo Code</b>
|
||
</a><br/>
|
||
<sub>⭐ 15.5K</sub>
|
||
</td>
|
||
</tr>
|
||
</table>
|
||
|
||
<sub>📡 Todos os agentes se conectam via <code>http://localhost:20128/v1</code> ou <code>http://cloud.omniroute.online/v1</code> — uma configuração, modelos e cota ilimitados</sub>
|
||
|
||
---
|
||
|
||
[](https://www.npmjs.com/package/omniroute)
|
||
[](https://hub.docker.com/r/diegosouzapw/omniroute)
|
||
[](https://github.com/diegosouzapw/OmniRoute/blob/main/LICENSE)
|
||
[](https://omniroute.online)
|
||
[](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
|
||
|
||
[🌐 Website](https://omniroute.online) • [🚀 Início Rápido](#-início-rápido) • [💡 Funcionalidades](#-funcionalidades-principais) • [📖 Docs](#-documentação) • [💰 Preços](#-preços-resumidos)
|
||
|
||
🌐 **Available in:** 🇺🇸 [English](../../README.md) | 🇧🇷 [Português (Brasil)](../pt-BR/README.md) | 🇪🇸 [Español](../es/README.md) | 🇫🇷 [Français](../fr/README.md) | 🇮🇹 [Italiano](../it/README.md) | 🇷🇺 [Русский](../ru/README.md) | 🇨🇳 [中文 (简体)](../zh-CN/README.md) | 🇩🇪 [Deutsch](../de/README.md) | 🇮🇳 [हिन्दी](../in/README.md) | 🇹🇭 [ไทย](../th/README.md) | 🇺🇦 [Українська](../uk-UA/README.md) | 🇸🇦 [العربية](../ar/README.md) | 🇯🇵 [日本語](../ja/README.md) | 🇻🇳 [Tiếng Việt](../vi/README.md) | 🇧🇬 [Български](../bg/README.md) | 🇩🇰 [Dansk](../da/README.md) | 🇫🇮 [Suomi](../fi/README.md) | 🇮🇱 [עברית](../he/README.md) | 🇭🇺 [Magyar](../hu/README.md) | 🇮🇩 [Bahasa Indonesia](../id/README.md) | 🇰🇷 [한국어](../ko/README.md) | 🇲🇾 [Bahasa Melayu](../ms/README.md) | 🇳🇱 [Nederlands](../nl/README.md) | 🇳🇴 [Norsk](../no/README.md) | 🇵🇹 [Português (Portugal)](../pt/README.md) | 🇷🇴 [Română](../ro/README.md) | 🇵🇱 [Polski](../pl/README.md) | 🇸🇰 [Slovenčina](../sk/README.md) | 🇸🇪 [Svenska](../sv/README.md) | 🇵🇭 [Filipino](../phi/README.md)
|
||
|
||
</div>
|
||
|
||
---
|
||
|
||
## 🖼️
|
||
|
||
<div align="center">
|
||
<img src="./docs/screenshots/MainOmniRoute.png" alt="OmniRoute" width="800"/>
|
||
</div>
|
||
|
||
---
|
||
|
||
## 📸
|
||
|
||
<details>
|
||
<summary><b>...</b></summary>
|
||
|
||
| # | # |
|
||
| ----- | ---------------------------------------- |
|
||
| **1** |  |
|
||
| **2** |  |
|
||
| **3** |  |
|
||
| **4** |  |
|
||
| **5** |  |
|
||
| **6** |  |
|
||
| **7** |  |
|
||
| **8** |  |
|
||
| **9** |  |
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🤔 Por que OmniRoute?
|
||
|
||
**Pare de desperdiçar dinheiro e bater em limites:**
|
||
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> Cota de assinatura expira sem uso todo mês
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> Limites de taxa param você no meio da programação
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> APIs caras ($20-50/mês por provedor)
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> Trocar manualmente entre provedores
|
||
|
||
**OmniRoute resolve isso:**
|
||
|
||
- ✅ **Maximize assinaturas** - Rastreie cotas, use tudo antes do reset
|
||
- ✅ **Fallback automático** - Assinatura → API Key → Barato → Gratuito, zero tempo de inatividade
|
||
- ✅ **Multi-conta** - Round-robin entre contas por provedor
|
||
- ✅ **Universal** - Funciona com Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, qualquer ferramenta CLI
|
||
|
||
---
|
||
|
||
## 📧 Suporte
|
||
|
||
> 💬 **Participe da comunidade!** [Grupo WhatsApp](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) — Tire dúvidas, compartilhe dicas e fique atualizado.
|
||
|
||
- **Website**: [omniroute.online](https://omniroute.online)
|
||
- **GitHub**: [github.com/diegosouzapw/OmniRoute](https://github.com/diegosouzapw/OmniRoute)
|
||
- **Issues**: [github.com/diegosouzapw/OmniRoute/issues](https://github.com/diegosouzapw/OmniRoute/issues)
|
||
- **WhatsApp**: [Grupo da Comunidade](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
|
||
- **Projeto Original**: [9router por decolua](https://github.com/decolua/9router)
|
||
|
||
---
|
||
|
||
## 🔄 Como Funciona
|
||
|
||
```
|
||
┌─────────────┐
|
||
│ Sua CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
|
||
│ Tool │
|
||
└──────┬──────┘
|
||
│ http://localhost:20128/v1
|
||
↓
|
||
┌─────────────────────────────────────────┐
|
||
│ OmniRoute (Roteador Inteligente) │
|
||
│ • Tradução de formato (OpenAI ↔ Claude) │
|
||
│ • Rastreamento de cota + Embeddings + Imagens │
|
||
│ • Renovação automática de tokens │
|
||
└──────┬──────────────────────────────────┘
|
||
│
|
||
├─→ [Tier 1: ASSINATURA] Claude Code, Codex, Gemini CLI
|
||
│ ↓ cota esgotada
|
||
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
|
||
│ ↓ limite de orçamento
|
||
├─→ [Tier 3: BARATO] GLM ($0.6/1M), MiniMax ($0.2/1M)
|
||
│ ↓ limite de orçamento
|
||
└─→ [Tier 4: GRATUITO] iFlow, Qwen, Kiro (ilimitado)
|
||
|
||
Resultado: Nunca pare de programar, custo mínimo
|
||
```
|
||
|
||
---
|
||
|
||
## 🎯 O que o OmniRoute resolve — 30 dores reais e casos de uso
|
||
|
||
> **Todo desenvolvedor que usa ferramentas de IA enfrenta esses problemas diariamente.** O OmniRoute foi criado para resolver todos eles, desde estouro de custos e bloqueios regionais até operações de protocolo e observabilidade de nível produção.
|
||
|
||
<details>
|
||
<summary><b>💸 1. "Pago uma assinatura cara e ainda sou interrompido por limites"</b></summary>
|
||
|
||
Desenvolvedores pagam de $20 a $200/mês por Claude Pro, Codex Pro ou GitHub Copilot. Mesmo pagando, há teto de cota, limite de 5h, limites semanais ou por minuto. No meio da sessão de coding, o provedor para de responder e o desenvolvedor perde fluxo e produtividade.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Fallback Inteligente em 4 Tiers** — Se a cota de assinatura acabar, redireciona automaticamente para API Key → Barato → Gratuito sem intervenção manual
|
||
- **Rastreamento de Cota em Tempo Real** — Exibe consumo de tokens ao vivo com contagem regressiva de reset (5h, diário, semanal)
|
||
- **Suporte Multi-Conta** — Várias contas por provedor com round-robin automático; quando uma esgota, passa para a próxima
|
||
- **Combos Personalizados** — Cadeias de fallback customizáveis com 6 estratégias (fill-first, round-robin, P2C, aleatório, least-used, cost-optimized)
|
||
- **Cotas Business do Codex** — Monitoramento de cota de workspace Business/Team direto no dashboard
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔌 2. "Preciso usar múltiplos provedores, mas cada um tem uma API diferente"</b></summary>
|
||
|
||
OpenAI usa um formato, Claude (Anthropic) usa outro, Gemini usa outro. Se o dev quer testar modelos de provedores diferentes ou fazer fallback entre eles, precisa reconfigurar SDKs, trocar endpoints e lidar com formatos incompatíveis. Provedores customizados (FriendLI, NIM) também têm endpoints não padronizados.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Endpoint Unificado** — Um único `http://localhost:20128/v1` serve como proxy para 36+ provedores
|
||
- **Tradução de Formato** — Conversão automática e transparente: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
|
||
- **Sanitização de Resposta** — Remove campos fora do padrão (`x_groq`, `usage_breakdown`, `service_tier`) que quebram OpenAI SDK v1.83+
|
||
- **Normalização de Roles** — Converte `developer` → `system` para provedores não-OpenAI; `system` → `user` para GLM/ERNIE
|
||
- **Extração de Tags Think** — Extrai blocos `<think>` de modelos como DeepSeek R1 para `reasoning_content` padronizado
|
||
- **Saída Estruturada no Gemini** — Conversão automática de `json_schema` → `responseMimeType`/`responseSchema`
|
||
- **`stream` padrão `false`** — Alinha com a especificação OpenAI e evita SSE inesperado em SDKs Python/Rust/Go
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌐 3. "Meu provedor de IA bloqueia minha região/país"</b></summary>
|
||
|
||
Provedores como OpenAI/Codex bloqueiam acesso em determinadas regiões. Usuários recebem erros como `unsupported_country_region_territory` durante OAuth e conexões de API. Isso é especialmente frustrante para desenvolvedores de países emergentes.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Config de Proxy em 3 Níveis** — Proxy configurável em nível global (todo tráfego), por provedor e por conexão/chave
|
||
- **Badges de Proxy por Cor** — Indicadores visuais: 🟢 proxy global, 🟡 proxy do provedor, 🔵 proxy da conexão, sempre mostrando o IP
|
||
- **Troca de Token OAuth via Proxy** — O fluxo OAuth também passa pelo proxy, resolvendo `unsupported_country_region_territory`
|
||
- **Teste de Conexão via Proxy** — Testes usam o proxy configurado (sem bypass direto)
|
||
- **Suporte SOCKS5** — Suporte completo a proxy SOCKS5 para roteamento de saída
|
||
- **Spoofing de Impressão TLS** — Fingerprint TLS estilo navegador via `wreq-js` para contornar detecção de bot
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🆓 4. "Quero usar IA para programar, mas não tenho dinheiro"</b></summary>
|
||
|
||
Nem todo mundo pode pagar $20–200/mês em assinaturas de IA. Estudantes, devs de países emergentes, hobistas e freelancers precisam de acesso a modelos de qualidade com custo zero.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Provedores Gratuitos nativos** — Suporte nativo a provedores 100% free: iFlow (8 modelos ilimitados), Qwen (3 ilimitados), Kiro (Claude grátis), Gemini CLI (180K/mês grátis)
|
||
- **Ollama Cloud** — Cloud-hosted Ollama models at `api.ollama.com` with free "Light usage" tier; use `ollamacloud/<model>` prefix
|
||
- **Combos Apenas Gratuitos** — Cadeia `gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus` = $0/mês com zero downtime
|
||
- **Créditos Gratuitos NVIDIA NIM** — 1000 créditos free integrados
|
||
- **Estratégia Cost Optimized** — Estratégia que escolhe automaticamente o provedor mais barato disponível
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔒 5. "Preciso proteger meu gateway de IA contra acesso não autorizado"</b></summary>
|
||
|
||
Ao expor um gateway de IA na rede (LAN, VPS, Docker), qualquer pessoa com o endereço pode consumir tokens/cota do desenvolvedor. Sem proteção, as APIs ficam vulneráveis a uso indevido, prompt injection e abuso.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Gestão de API Keys** — Geração, rotação e escopo por provedor com página dedicada em `/dashboard/api-manager`
|
||
- **Permissões por Modelo** — Restringe chaves a modelos específicos (`openai/*`, padrões wildcard), com toggle Allow All/Restrict
|
||
- **Proteção de Endpoint de API** — Exige chave para `/v1/models` e bloqueia provedores específicos da listagem
|
||
- **Auth Guard + CSRF Protection** — Todas as rotas do dashboard protegidas com middleware `withAuth` + tokens CSRF
|
||
- **Rate Limiter** — Limite por IP com janelas configuráveis
|
||
- **Filtragem por IP** — Allowlist/blocklist para controle de acesso
|
||
- **Proteção contra Prompt Injection** — Sanitização contra padrões maliciosos
|
||
- **Criptografia AES-256-GCM** — Credenciais criptografadas em repouso
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🛑 6. "Meu provedor caiu e eu perdi meu fluxo de programação"</b></summary>
|
||
|
||
Provedores de IA podem ficar instáveis, retornar erro 5xx ou atingir limites temporários de taxa. Se o dev depende de um único provedor, ele é interrompido. Sem circuit breaker, retries repetidos podem derrubar a aplicação.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Circuit Breaker por modelo** — Abre/fecha automaticamente com limiares e cooldown configuráveis (Closed/Open/Half-Open)
|
||
- **Exponential Backoff** — Atrasos progressivos de retry
|
||
- **Anti-Thundering Herd** — Proteção com mutex + semáforo contra tempestade de retries concorrentes
|
||
- **Cadeias de Fallback em Combo** — Se o primário falhar, avança automaticamente na cadeia sem intervenção
|
||
- **Circuit Breaker de Combo** — Desativa automaticamente provedores com falha dentro da cadeia
|
||
- **Health Dashboard** — Monitoramento de uptime, estados de breaker, lockouts, estatísticas de cache e latência p50/p95/p99
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔧 7. "Configurar cada ferramenta de IA é tedioso e repetitivo"</b></summary>
|
||
|
||
Desenvolvedores usam Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Cada ferramenta pede configuração diferente (endpoint, chave, modelo). Reconfigurar ao trocar de provedor ou modelo é perda de tempo.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Dashboard de Ferramentas CLI** — Página dedicada com setup em 1 clique para Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity e Cline
|
||
- **Gerador de Config do GitHub Copilot** — Gera `chatLanguageModels.json` para VS Code com seleção em lote de modelos
|
||
- **Onboarding Wizard** — Fluxo guiado de 4 etapas para novos usuários
|
||
- **Um endpoint para todos os modelos** — Configure `http://localhost:20128/v1` uma vez e acesse 36+ provedores
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔑 8. "Gerenciar tokens OAuth de múltiplos provedores é um caos"</b></summary>
|
||
|
||
Claude Code, Codex, Gemini CLI e Copilot usam OAuth 2.0 com tokens que expiram. Devs precisam reautenticar o tempo todo e lidar com erros como `client_secret is missing`, `redirect_uri_mismatch` e falhas em servidores remotos. OAuth em LAN/VPS é especialmente problemático.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Auto Token Refresh** — Tokens OAuth renovados em background antes da expiração
|
||
- **OAuth 2.0 (PKCE) nativo** — Fluxo automático para Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen e iFlow
|
||
- **OAuth Multi-Conta** — Múltiplas contas por provedor via extração de JWT/ID token
|
||
- **Correções OAuth LAN/Remoto** — Detecção de IP privado para `redirect_uri` + modo manual de URL para servidores remotos
|
||
- **OAuth atrás de Nginx** — Usa `window.location.origin` para compatibilidade com reverse proxy
|
||
- **Guia de OAuth Remoto** — Passo a passo para credenciais Google Cloud em VPS/Docker
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📊 9. "Não sei quanto estou gastando nem onde"</b></summary>
|
||
|
||
Desenvolvedores usam vários provedores pagos, mas não têm visão unificada de gastos. Cada provedor tem seu dashboard de billing, sem consolidação. Custos inesperados podem se acumular.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Dashboard de Analytics de Custo** — Rastreamento de custo por token e gestão de orçamento por provedor
|
||
- **Limites de Orçamento por Tier** — Teto de gasto por tier que aciona fallback automático
|
||
- **Configuração de Preço por Modelo** — Preços configuráveis por modelo
|
||
- **Estatísticas de Uso por API Key** — Contagem de requests e timestamp de último uso por chave
|
||
- **Analytics Dashboard** — Cards, gráfico de uso por modelo e tabela de provedores com taxa de sucesso e latência
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🐛 10. "Não consigo diagnosticar erros e problemas nas chamadas de IA"</b></summary>
|
||
|
||
Quando uma chamada falha, o dev não sabe se foi rate limit, token expirado, formato incorreto ou erro do provedor. Logs ficam fragmentados em terminais diferentes. Sem observabilidade, debug vira tentativa e erro.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Dashboard de Logs Unificado** — 4 abas: Request Logs, Proxy Logs, Audit Logs e Console
|
||
- **Visualizador de Console** — Viewer em tempo real estilo terminal com níveis por cor, auto-scroll, busca e filtros
|
||
- **Proxy Logs em SQLite** — Logs persistentes que sobrevivem a reinícios do servidor
|
||
- **Playground do Tradutor** — 4 modos de debug: Playground (tradução), Chat Tester (round-trip), Test Bench (lote), Live Monitor (tempo real)
|
||
- **Telemetria de Request** — Latência p50/p95/p99 + rastreamento por X-Request-Id
|
||
- **Logging em Arquivo com Rotação** — Interceptador de console grava tudo em JSON com rotação por tamanho
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🏗️ 11. "Implantar e manter o gateway é complexo"</b></summary>
|
||
|
||
Instalar, configurar e manter um proxy de IA em ambientes diferentes (local, VPS, Docker, cloud) exige muito trabalho. Problemas como caminhos hardcoded, `EACCES` em diretórios, conflito de portas e build cross-platform aumentam a fricção.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Instalação global via npm** — `npm install -g omniroute && omniroute` e pronto
|
||
- **Docker Multi-Platform** — AMD64 + ARM64 nativo (Apple Silicon, AWS Graviton, Raspberry Pi)
|
||
- **Perfis Docker Compose** — `base` (sem ferramentas CLI) e `cli` (com Claude Code, Codex, OpenClaw)
|
||
- **App Desktop Electron** — App nativo para Windows/macOS/Linux com bandeja, auto-start e modo offline
|
||
- **Modo de Porta Separada** — API e Dashboard em portas distintas para cenários avançados (reverse proxy, rede de containers)
|
||
- **Cloud Sync** — Sincronização de configuração entre dispositivos via Cloudflare Workers
|
||
- **Backups de DB** — Backup automático, restauração, export e import de todas as configurações
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌍 12. "A interface é só em inglês e meu time não fala inglês"</b></summary>
|
||
|
||
Times em países não anglófonos, especialmente na América Latina, Ásia e Europa, sofrem com interfaces só em inglês. A barreira de idioma reduz adoção e aumenta erros de configuração.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **i18n do Dashboard — 30 idiomas** — Mais de 500 chaves traduzidas, incluindo árabe, búlgaro, dinamarquês, alemão, espanhol, finlandês, francês, hebraico, hindi, húngaro, indonésio, italiano, japonês, coreano, malaio, holandês, norueguês, polonês, português (PT/BR), romeno, russo, eslovaco, sueco, tailandês, ucraniano, vietnamita, chinês, filipino e inglês
|
||
- **Suporte RTL** — Suporte right-to-left para árabe e hebraico
|
||
- **READMEs multilíngues** — 30 traduções completas de documentação
|
||
- **Seletor de Idioma** — Ícone de globo no header para troca em tempo real
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔄 13. "Preciso de mais do que chat: embeddings, imagens, áudio"</b></summary>
|
||
|
||
IA não é só chat completion. Devs precisam gerar imagens, transcrever áudio, criar embeddings para RAG, reranquear documentos e moderar conteúdo. Cada API tem endpoint e formato diferentes.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Embeddings** — `/v1/embeddings` com 6 provedores e 9+ modelos
|
||
- **Geração de Imagem** — `/v1/images/generations` com 10 provedores e 20+ modelos (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
|
||
- **Texto para Vídeo** — `/v1/videos/generations` com ComfyUI (AnimateDiff, SVD) e SD WebUI
|
||
- **Texto para Música** — `/v1/music/generations` com ComfyUI (Stable Audio Open, MusicGen)
|
||
- **Transcrição de Áudio** — `/v1/audio/transcriptions` com Whisper + Nvidia NIM, HuggingFace e Qwen3
|
||
- **Texto para Fala (TTS)** — `/v1/audio/speech` com ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise e Qwen3
|
||
- **Moderações** — `/v1/moderations` para checagens de segurança de conteúdo
|
||
- **Reranking** — `/v1/rerank` para relevância de documentos
|
||
- **Responses API** — Suporte completo a `/v1/responses` para Codex
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧪 14. "Não tenho como testar e comparar qualidade entre modelos"</b></summary>
|
||
|
||
Desenvolvedores querem saber qual modelo é melhor para cada caso de uso (código, tradução, raciocínio), mas comparar manualmente é lento. Não existem ferramentas integradas de avaliação na maioria das stacks.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Avaliações de LLM** — Golden set com 10 casos pré-carregados cobrindo saudação, matemática, geografia, geração de código, conformidade JSON, tradução, markdown e recusa de conteúdo inseguro
|
||
- **4 Estratégias de Match** — `exact`, `contains`, `regex`, `custom` (função JS)
|
||
- **Test Bench do Playground do Tradutor** — Testes em lote com múltiplas entradas/saídas esperadas e comparação entre provedores
|
||
- **Chat Tester** — Round-trip completo com renderização visual da resposta
|
||
- **Live Monitor** — Stream em tempo real de todas as requisições que passam pelo proxy
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📈 15. "Preciso escalar sem perder performance"</b></summary>
|
||
|
||
À medida que o volume cresce, sem cache as mesmas perguntas geram custos duplicados. Sem idempotência, requisições duplicadas desperdiçam processamento. Também é necessário respeitar rate limits por provedor.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Cache Semântico** — Cache em duas camadas (assinatura + semântico) para reduzir custo e latência
|
||
- **Idempotência de Request** — Janela de deduplicação de 5s para requisições idênticas
|
||
- **Detecção de Rate Limit** — Rastreamento por provedor de RPM, intervalo mínimo e concorrência máxima
|
||
- **Rate Limits Editáveis** — Padrões configuráveis em Settings → Resilience com persistência
|
||
- **Cache de Validação de API Key** — Cache em 3 camadas para performance em produção
|
||
- **Health Dashboard com Telemetria** — Latência p50/p95/p99, estatísticas de cache e uptime
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🤖 16. "Quero controlar o comportamento dos modelos globalmente"</b></summary>
|
||
|
||
Desenvolvedores podem querer todas as respostas em um idioma específico, com tom específico ou com limite de tokens de raciocínio. Configurar isso em cada ferramenta/requisição é impraticável.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- **Injeção de System Prompt** — Prompt global aplicado a todas as requisições
|
||
- **Validação de Thinking Budget** — Controle de alocação de tokens de raciocínio por requisição (passthrough, auto, custom, adaptive)
|
||
- **6 Estratégias de Roteamento** — Estratégias globais que definem como as requisições são distribuídas
|
||
- **Wildcard Router** — Padrões `provider/*` roteiam dinamicamente para qualquer provedor
|
||
- **Toggle de Combo** — Ativa/desativa combos diretamente no dashboard
|
||
- **Toggle de Provedor** — Ativa/desativa todas as conexões de um provedor com um clique
|
||
- **Provedores Bloqueados** — Exclui provedores específicos da listagem de `/v1/models`
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧰 17. "Preciso de ferramentas MCP como capacidades de primeira classe do produto"</b></summary>
|
||
|
||
Muitos gateways de IA expõem MCP apenas como detalhe de implementação oculto. Times precisam de uma camada operacional visível e gerenciável.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- MCP aparece no menu do dashboard e na aba de protocolos em Endpoint
|
||
- Página dedicada de gestão MCP com processo, ferramentas, escopos e auditoria
|
||
- Quick-start embutido para `omniroute --mcp` e onboarding de clientes
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧠 18. "Preciso de orquestração A2A com caminhos síncronos + streaming"</b></summary>
|
||
|
||
Fluxos de agentes precisam de respostas diretas e também de execuções longas com streaming e controle de ciclo de vida.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Endpoint A2A JSON-RPC (`POST /a2a`) com `message/send` e `message/stream`
|
||
- Streaming SSE com propagação de estado terminal
|
||
- APIs de ciclo de vida de tarefas para `tasks/get` e `tasks/cancel`
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🛰️ 19. "Preciso de saúde real do processo MCP, não status estimado"</b></summary>
|
||
|
||
Times operacionais precisam saber se o MCP está realmente ativo, não apenas se uma API está respondendo.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Arquivo de heartbeat em runtime com PID, timestamps, transporte, quantidade de ferramentas e modo de escopo
|
||
- API de status MCP combinando heartbeat + atividade recente
|
||
- Cards de status na UI para processo/uptime/frescor do heartbeat
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📋 20. "Preciso de execução auditável das ferramentas MCP"</b></summary>
|
||
|
||
Quando ferramentas alteram configuração ou disparam ações operacionais, os times precisam de rastreabilidade forense.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Auditoria de chamadas MCP baseada em SQLite
|
||
- Filtros por ferramenta, sucesso/falha, chave de API e paginação
|
||
- Tabela de auditoria no dashboard + endpoints de métricas para automação
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔐 21. "Preciso de permissões MCP por escopo para cada integração"</b></summary>
|
||
|
||
Clientes diferentes devem operar com privilégio mínimo por categoria de ferramenta.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- 9 escopos MCP granulares para controle de acesso às ferramentas
|
||
- Aplicação de escopo e visibilidade na UI de gestão MCP
|
||
- Postura segura por padrão para operações sensíveis
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>⚙️ 22. "Preciso de controles operacionais sem redeploy"</b></summary>
|
||
|
||
Times precisam de mudanças rápidas em runtime durante incidentes e picos de custo.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Troca de ativação de combo direto no dashboard de MCP
|
||
- Aplicação de perfis de resiliência via pacotes de política prontos
|
||
- Reset de circuit breaker no mesmo painel operacional
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔄 23. "Preciso de visibilidade ao vivo do ciclo de vida A2A e cancelamento"</b></summary>
|
||
|
||
Sem visibilidade de lifecycle, incidentes de tarefas ficam difíceis de investigar e corrigir.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Listagem/filtragem de tarefas por estado/skill com paginação
|
||
- Drill-down de metadados, eventos e artefatos da tarefa
|
||
- Endpoint de cancelamento + ação de UI com confirmação
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌊 24. "Preciso de métricas de streams ativos para carga A2A"</b></summary>
|
||
|
||
Fluxos em streaming exigem visão operacional de concorrência e conexões ativas.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Contadores de streams ativos integrados ao status A2A
|
||
- Timestamp da última tarefa e contagens por estado
|
||
- Cards no dashboard A2A para monitoramento operacional em tempo real
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🪪 25. "Preciso de descoberta padrão de agente para clientes"</b></summary>
|
||
|
||
Clientes externos e orquestradores precisam de metadados legíveis por máquina para onboarding automático.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Agent Card exposto em `/.well-known/agent.json`
|
||
- Capacidades e skills exibidas na UI de gestão
|
||
- API de status A2A inclui metadados de descoberta para automação
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧭 26. "Preciso de descobribilidade de protocolos na experiência do produto"</b></summary>
|
||
|
||
Se os usuários não encontram superfícies de protocolo, adoção e qualidade de suporte caem.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Entradas MCP e A2A na sidebar
|
||
- Aba Protocolos em Endpoint com quick-start e status
|
||
- Links do overview para dashboards dedicados de gestão
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧪 27. "Preciso de validação end-to-end de protocolo com clientes reais"</b></summary>
|
||
|
||
Testes mockados não bastam para validar compatibilidade de protocolo antes do release.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Suíte E2E que sobe a aplicação e usa transporte real do SDK MCP
|
||
- Testes de cliente A2A para discovery, send, stream, get e cancel
|
||
- Cross-check das validações com APIs de auditoria MCP e tarefas A2A
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📡 28. "Preciso de observabilidade unificada em todas as interfaces"</b></summary>
|
||
|
||
Separar observabilidade por protocolo cria pontos cegos e aumenta o MTTR.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Dashboards/logs/analytics unificados no mesmo produto
|
||
- Saúde + auditoria + telemetria de requisição em OpenAI, MCP e A2A
|
||
- APIs operacionais de status para automação
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>💼 29. "Preciso de um runtime único para proxy + tools + orquestração de agentes"</b></summary>
|
||
|
||
Manter vários serviços separados aumenta custo operacional e modos de falha.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Proxy OpenAI-compatible, servidor MCP e servidor A2A na mesma stack
|
||
- Autenticação, resiliência, armazenamento e observabilidade compartilhados
|
||
- Modelo de políticas consistente em todas as superfícies de interação
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🚀 30. "Preciso entregar workflows agênticos sem sprawl de glue code"</b></summary>
|
||
|
||
Times perdem velocidade quando precisam costurar múltiplos serviços e scripts ad hoc.
|
||
|
||
**Como o OmniRoute resolve isso:**
|
||
|
||
- Estratégia de endpoint unificada para clientes e agentes
|
||
- UIs de gestão de protocolo e fluxos de validação/smoke embutidos
|
||
- Base pronta para produção (segurança, logging, resiliência e backup)
|
||
|
||
</details>
|
||
|
||
### Exemplos de Playbooks (Casos de Uso Integrados)
|
||
|
||
**Playbook A: Maximizar assinatura paga + backup barato**
|
||
|
||
```txt
|
||
Combo: "maximize-claude"
|
||
1. cc/claude-opus-4-6
|
||
2. glm/glm-4.7
|
||
3. if/kimi-k2-thinking
|
||
|
||
Custo mensal: $20 + pequeno gasto de backup
|
||
Resultado: qualidade maior, interrupção quase zero
|
||
```
|
||
|
||
**Playbook B: Stack de programação com custo zero**
|
||
|
||
```txt
|
||
Combo: "free-forever"
|
||
1. gc/gemini-3-flash
|
||
2. if/kimi-k2-thinking
|
||
3. qw/qwen3-coder-plus
|
||
|
||
Custo mensal: $0
|
||
Resultado: fluxo de coding gratuito e estável
|
||
```
|
||
|
||
## ⚡ Início Rápido
|
||
|
||
**1. Instale globalmente:**
|
||
|
||
```bash
|
||
npm install -g omniroute
|
||
omniroute
|
||
```
|
||
|
||
🎉 Dashboard abre em `http://localhost:20128`
|
||
|
||
| Comando | Descrição |
|
||
| ----------------------- | ------------------------------------- |
|
||
| `omniroute` | Iniciar servidor (porta padrão 20128) |
|
||
| `omniroute --port 3000` | Usar porta personalizada |
|
||
| `omniroute --no-open` | Não abrir navegador automaticamente |
|
||
| `omniroute --help` | Mostrar ajuda |
|
||
|
||
**2. Conecte um provedor GRATUITO:**
|
||
|
||
Dashboard → Provedores → Conectar **Claude Code** ou **Antigravity** → Login OAuth → Pronto!
|
||
|
||
**3. Use na sua ferramenta CLI:**
|
||
|
||
```
|
||
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Configurações:
|
||
Endpoint: http://localhost:20128/v1
|
||
API Key: [copie do dashboard]
|
||
Model: if/kimi-k2-thinking
|
||
```
|
||
|
||
**Pronto!** Comece a programar com modelos de IA GRATUITOS.
|
||
|
||
**Alternativa — rodar a partir do código-fonte:**
|
||
|
||
```bash
|
||
cp .env.example .env
|
||
npm install
|
||
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev
|
||
```
|
||
|
||
---
|
||
|
||
## 🐳 Docker
|
||
|
||
OmniRoute está disponível como imagem Docker pública no [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute).
|
||
|
||
**Execução rápida:**
|
||
|
||
```bash
|
||
docker run -d \
|
||
--name omniroute \
|
||
--restart unless-stopped \
|
||
-p 20128:20128 \
|
||
-v omniroute-data:/app/data \
|
||
diegosouzapw/omniroute:latest
|
||
```
|
||
|
||
**Com arquivo de ambiente:**
|
||
|
||
```bash
|
||
# Copie e edite o .env primeiro
|
||
cp .env.example .env
|
||
|
||
docker run -d \
|
||
--name omniroute \
|
||
--restart unless-stopped \
|
||
--env-file .env \
|
||
-p 20128:20128 \
|
||
-v omniroute-data:/app/data \
|
||
diegosouzapw/omniroute:latest
|
||
```
|
||
|
||
**Usando Docker Compose:**
|
||
|
||
```bash
|
||
# Perfil base (sem ferramentas CLI)
|
||
docker compose --profile base up -d
|
||
|
||
# Perfil CLI (Claude Code, Codex, OpenClaw integrados)
|
||
docker compose --profile cli up -d
|
||
```
|
||
|
||
| Imagem | Tag | Tamanho | Descrição |
|
||
| ------------------------ | -------- | ------- | --------------------- |
|
||
| `diegosouzapw/omniroute` | `latest` | ~250MB | Última versão estável |
|
||
| `diegosouzapw/omniroute` | `1.0.6` | ~250MB | Versão atual |
|
||
|
||
---
|
||
|
||
---
|
||
|
||
## 🖥️
|
||
|
||
> 🆕 **NOVO!** O OmniRoute agora está disponível como **aplicativo desktop nativo** para Windows, macOS e Linux.
|
||
|
||
Execute o OmniRoute como um aplicativo desktop autônomo — sem terminal, sem navegador, sem internet necessária para modelos locais. O app baseado em Electron inclui:
|
||
|
||
- 🖥️ **Janela Nativa** — Janela dedicada com integração à bandeja do sistema
|
||
- 🔄 **Iniciar Automaticamente** — Inicie o OmniRoute ao fazer login no sistema
|
||
- 🔔 **Notificações Nativas** — Receba alertas sobre esgotamento de cota ou problemas
|
||
- ⚡ **Instalação com Um Clique** — NSIS (Windows), DMG (macOS), AppImage (Linux)
|
||
- 🌐 **Modo Offline** — Funciona totalmente offline com servidor embarcado
|
||
|
||
### Início Rápido
|
||
|
||
```bash
|
||
# Modo desenvolvimento
|
||
npm run electron:dev
|
||
|
||
# Compilar para sua plataforma
|
||
npm run electron:build # Plataforma atual
|
||
npm run electron:build:win # Windows (.exe)
|
||
npm run electron:build:mac # macOS (.dmg) — x64 & arm64
|
||
npm run electron:build:linux # Linux (.AppImage)
|
||
```
|
||
|
||
### Bandeja do Sistema
|
||
|
||
Quando minimizado, o OmniRoute fica na bandeja do sistema com ações rápidas:
|
||
|
||
- Abrir dashboard
|
||
- Alterar porta do servidor
|
||
- Sair do aplicativo
|
||
|
||
📖 Documentação completa: [`electron/README.md`](electron/README.md)
|
||
|
||
---
|
||
|
||
## 💰 Preços Resumidos
|
||
|
||
| Tier | Provedor | Custo | Reset de Cota | Melhor Para |
|
||
| ----------------- | ----------------- | ---------------------------- | ----------------- | ----------------------- |
|
||
| **💳 ASSINATURA** | Claude Code (Pro) | $20/mês | 5h + semanal | Já é assinante |
|
||
| | Codex (Plus/Pro) | $20-200/mês | 5h + semanal | Usuários OpenAI |
|
||
| | Gemini CLI | **GRATUITO** | 180K/mês + 1K/dia | Todos! |
|
||
| | GitHub Copilot | $10-19/mês | Mensal | Usuários GitHub |
|
||
| **🔑 API KEY** | NVIDIA NIM | **GRATUITO** (1000 créditos) | Único | Testes gratuitos |
|
||
| | DeepSeek | Por uso | Nenhum | Melhor preço/qualidade |
|
||
| | Groq | Tier gratuito + pago | Limitado | Inferência ultra-rápida |
|
||
| | xAI (Grok) | Por uso | Nenhum | Modelos Grok |
|
||
| | Mistral | Tier gratuito + pago | Limitado | IA Europeia |
|
||
| | OpenRouter | Por uso | Nenhum | 100+ modelos |
|
||
| **💰 BARATO** | GLM-4.7 | $0.6/1M | Diário 10h | Backup econômico |
|
||
| | MiniMax M2.1 | $0.2/1M | Rotativo 5h | Opção mais barata |
|
||
| | Kimi K2 | $9/mês fixo | 10M tokens/mês | Custo previsível |
|
||
| **🆓 GRATUITO** | iFlow | $0 | Ilimitado | 8 modelos gratuitos |
|
||
| | Qwen | $0 | Ilimitado | 3 modelos gratuitos |
|
||
| | Kiro | $0 | Ilimitado | Claude gratuito |
|
||
|
||
**💡 Dica Pro:** Comece com Gemini CLI (180K grátis/mês) + iFlow (ilimitado grátis) = $0 de custo!
|
||
|
||
---
|
||
|
||
## 💡 Funcionalidades Principais
|
||
|
||
### 🧭 Gestão MCP + A2A (Camada Operacional)
|
||
|
||
A maioria dos gateways de IA expõe MCP/A2A apenas como endpoints “escondidos”. O OmniRoute traz operação de primeira classe para os dois protocolos:
|
||
|
||
- **Descoberta na interface** — Entradas `MCP` e `A2A` na sidebar e aba `Protocolos` na página de Endpoint com quick-start e cartões de status.
|
||
- **Painel operacional MCP** (`/dashboard/mcp`) — Status real do processo por heartbeat, inventário de ferramentas/scopes, auditoria com filtros e controles operacionais (trocar combo, aplicar perfil de resiliência, resetar breakers).
|
||
- **Painel operacional A2A** (`/dashboard/a2a`) — Visão do agent card, ciclo de vida de tarefas por estado, contagem de streams ativos, drill-down/cancelamento de tasks e smoke tests de `message/send` e `message/stream`.
|
||
- **APIs de monitoramento** — Endpoints `/api/mcp/*` e `/api/a2a/*` para status, tasks, auditoria e automações externas.
|
||
|
||
Por que isso é relevante:
|
||
|
||
- **Um runtime, três papéis**: router/proxy OpenAI-compatible + servidor de ferramentas MCP + servidor agente A2A.
|
||
- **Governança unificada**: autenticação, auditoria e controles de resiliência compartilhados.
|
||
- **Operação confiável**: times conseguem validar, monitorar e depurar comportamento dos protocolos sem sair do produto.
|
||
|
||
### 🧠 Roteamento e Inteligência
|
||
|
||
| Funcionalidade | O que Faz |
|
||
| ----------------------------------------- | ---------------------------------------------------------------------------------- |
|
||
| 🎯 **Fallback Inteligente 4 Tiers** | Auto-roteamento: Assinatura → API Key → Barato → Gratuito |
|
||
| 📊 **Rastreamento de Cota em Tempo Real** | Contagem de tokens ao vivo + countdown de reset por provedor |
|
||
| 🔄 **Tradução de Formato** | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro transparente |
|
||
| 👥 **Suporte Multi-Conta** | Múltiplas contas por provedor com seleção inteligente |
|
||
| 🔄 **Renovação Automática de Token** | Tokens OAuth renovam automaticamente com retry |
|
||
| 🎨 **Combos Personalizados** | 6 estratégias: fill-first, round-robin, p2c, random, least-used, cost-optimized |
|
||
| 🧩 **Modelos Personalizados** | Adicione qualquer ID de modelo a qualquer provedor |
|
||
| 🌐 **Roteador Wildcard** | Roteie padrões `provider/*` para qualquer provedor dinamicamente |
|
||
| 🧠 **Budget de Raciocínio** | Modos passthrough, auto, custom e adaptativo para modelos de raciocínio |
|
||
| <20> **Aliases de Modelo** | Redireciona IDs de modelos depreciados para substitutos atuais (built-in + custom) |
|
||
| ⚡ **Degradação em Background** | Redireciona tarefas em background (títulos, resumos) para modelos mais baratos |
|
||
| <20>💬 **Injeção de System Prompt** | System prompt global aplicado em todas as requisições |
|
||
| 📄 **API Responses** | Suporte completo à API Responses da OpenAI (`/v1/responses`) para Codex |
|
||
|
||
### 🎵 APIs Multi-Modal
|
||
|
||
| Funcionalidade | O que Faz |
|
||
| --------------------------- | ----------------------------------------------------------------------------------------------------------- |
|
||
| 🖼️ **Geração de Imagem** | `/v1/images/generations` — 10 provedores, 20+ modelos (cloud + local) |
|
||
| 📐 **Embeddings** | `/v1/embeddings` — 6 provedores, 9+ modelos |
|
||
| 🎤 **Transcrição de Áudio** | `/v1/audio/transcriptions` — Whisper + Nvidia NIM, HuggingFace, Qwen3 |
|
||
| 🔊 **Texto para Fala** | `/v1/audio/speech` — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT |
|
||
| 🎬 **Geração de Vídeo** | `/v1/videos/generations` — ComfyUI (AnimateDiff, SVD), SD WebUI |
|
||
| 🎵 **Geração de Música** | `/v1/music/generations` — ComfyUI (Stable Audio Open, MusicGen) |
|
||
| 🛡️ **Moderações** | `/v1/moderations` — Verificações de segurança |
|
||
| 🔀 **Reranking** | `/v1/rerank` — Reranking de relevância de documentos |
|
||
|
||
### 🛡️ Resiliência e Segurança
|
||
|
||
| Funcionalidade | O que Faz |
|
||
| ----------------------------------- | ----------------------------------------------------------------------------- |
|
||
| 🔌 **Circuit Breaker** | Trip/recover por modelo com limites configuráveis |
|
||
| 🎯 **Endpoint-Aware Models** | Custom models declare supported endpoints + API format |
|
||
| 🛡️ **Anti-Thundering Herd** | Mutex + semáforo rate-limit para provedores com API key |
|
||
| 🧠 **Cache Semântico** | Cache de duas camadas (assinatura + semântico) reduz custo e latência |
|
||
| ⚡ **Idempotência de Requisição** | Janela de dedup de 5s para requisições duplicadas |
|
||
| 🔒 **Spoofing de Fingerprint TLS** | Bypass de detecção de bot via TLS com wreq-js |
|
||
| 🌐 **Filtragem de IP** | Allowlist/blocklist para controle de acesso à API |
|
||
| 📊 **Rate Limits Editáveis** | RPM, gap mínimo e concorrência máxima configuráveis |
|
||
| 💾 **Persistência de Rate Limits** | Limites aprendidos persistem via SQLite com debounce de 60s + 24h de validade |
|
||
| 🔄 **Resiliência de Token Refresh** | Circuit breaker por provedor (5 falhas→30min) + timeout de 30s por tentativa |
|
||
| 🛡 **Proteção de Endpoint API** | Gateway de Auth + bloqueio de provedores para o endpoint `/models` |
|
||
| 🔒 **Visibilidade de Proxy** | Badges coloridos: 🟢 global, 🟡 provedor, 🔵 por-conexão com exibição de IP |
|
||
| 🌐 **Proxy em 3 Níveis** | Configure proxies em nível global, por provedor ou por conexão |
|
||
|
||
### 📊 Observabilidade e Analytics
|
||
|
||
| Funcionalidade | O que Faz |
|
||
| -------------------------------- | --------------------------------------------------------------------- |
|
||
| 📝 **Logs de Requisição** | Modo debug com logs completos de request/response |
|
||
| 💾 **Logs SQLite** | Logs de proxy persistentes sobrevivem a reinicializações |
|
||
| 📊 **Dashboard de Analytics** | Recharts: cards de estatísticas, gráfico de uso, tabela de provedores |
|
||
| 📈 **Rastreamento de Progresso** | Eventos de progresso SSE opt-in para streaming |
|
||
| 🧪 **Avaliações de LLM** | Testes com conjunto golden e 4 estratégias de match |
|
||
| 🔍 **Telemetria de Requisição** | Agregação de latência p50/p95/p99 + rastreamento X-Request-Id |
|
||
| 📋 **Logs + Cotas** | Páginas dedicadas para navegação de logs e rastreamento de cotas |
|
||
| 🏥 **Dashboard de Saúde** | Uptime, estados de circuit breaker, lockouts, stats de cache |
|
||
| 💰 **Rastreamento de Custo** | Gestão de orçamento + configuração de preços por modelo |
|
||
|
||
### ☁️ Deploy e Sincronização
|
||
|
||
| Funcionalidade | O que Faz |
|
||
| --------------------------------- | --------------------------------------------------------------------------------- |
|
||
| 💾 **Cloud Sync** | Sincronize configurações entre dispositivos via Cloudflare Workers |
|
||
| 🌐 **Deploy em Qualquer Lugar** | Localhost, VPS, Docker, Cloudflare Workers |
|
||
| 🔑 **Gestão de API Keys** | Gere, rotacione e defina escopo de API keys por provedor |
|
||
| 🧙 **Assistente de Configuração** | Setup guiado em 4 etapas para novos usuários |
|
||
| 🔧 **Dashboard CLI Tools** | Configuração em um clique para Claude, Codex, Cline, OpenClaw, Kilo, Antigravity |
|
||
| 🔄 **Backups de DB** | Backup, restauração, exportação e importação automática de todas as configurações |
|
||
| 🌐 **Internacionalização** | i18n completo com next-intl — suporte a 30 idiomas com RTL |
|
||
| 🌍 **Seletor de Idioma** | Ícone de globo no cabeçalho para troca entre 30 idiomas em tempo real |
|
||
| 📂 **Diretório de Dados Custom** | Variável `DATA_DIR` para sobrescrever o caminho padrão `~/.omniroute` |
|
||
|
||
<details>
|
||
<summary><b>📖 Detalhes das Funcionalidades</b></summary>
|
||
|
||
### 🎯 Fallback Inteligente 4 Tiers
|
||
|
||
Crie combos com fallback automático:
|
||
|
||
```
|
||
Combo: "my-coding-stack"
|
||
1. cc/claude-opus-4-6 (sua assinatura)
|
||
2. nvidia/llama-3.3-70b (API NVIDIA gratuita)
|
||
3. glm/glm-4.7 (backup barato, $0.6/1M)
|
||
4. if/kimi-k2-thinking (fallback gratuito)
|
||
|
||
→ Troca automaticamente quando a cota acaba ou erros ocorrem
|
||
```
|
||
|
||
### 📊 Rastreamento de Cota em Tempo Real
|
||
|
||
- Consumo de tokens por provedor
|
||
- Countdown de reset (5 horas, diário, semanal)
|
||
- Estimativa de custo para tiers pagos
|
||
- Relatórios de gastos mensais
|
||
|
||
### 🔄 Tradução de Formato
|
||
|
||
Tradução transparente entre formatos:
|
||
|
||
- **OpenAI** ↔ **Claude** ↔ **Gemini** ↔ **OpenAI Responses**
|
||
- Sua ferramenta CLI envia formato OpenAI → OmniRoute traduz → Provedor recebe formato nativo
|
||
- Funciona com qualquer ferramenta que suporte endpoints OpenAI customizados
|
||
|
||
### 👥 Suporte Multi-Conta
|
||
|
||
- Adicione múltiplas contas por provedor
|
||
- Round-robin automático ou roteamento por prioridade
|
||
- Fallback para próxima conta quando uma atinge a cota
|
||
|
||
### 🔄 Renovação Automática de Token
|
||
|
||
- Tokens OAuth renovam automaticamente antes de expirar
|
||
- Sem necessidade de re-autenticação manual
|
||
- Experiência transparente em todos os provedores
|
||
|
||
### 🎨 Combos Personalizados
|
||
|
||
- Crie combinações ilimitadas de modelos
|
||
- 6 estratégias: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized
|
||
- Compartilhe combos entre dispositivos com Cloud Sync
|
||
|
||
### 🏥 Dashboard de Saúde
|
||
|
||
- Status do sistema (uptime, versão, uso de memória)
|
||
- Estados de circuit breaker por provedor (Closed/Open/Half-Open)
|
||
- Status de rate limit e lockouts ativos
|
||
- Estatísticas de cache de assinatura
|
||
- Telemetria de latência (p50/p95/p99) + cache de prompt
|
||
- Reset de saúde com um clique
|
||
|
||
### 🔧 Playground do Tradutor
|
||
|
||
O OmniRoute inclui um poderoso Playground de Tradução integrado com **4 modos** para debug, teste e monitoramento de traduções de API:
|
||
|
||
| Modo | Descrição |
|
||
| ------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
|
||
| **💻 Playground** | Tradução direta entre formatos — cole qualquer corpo de requisição e veja instantaneamente como o OmniRoute traduz entre formatos (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). Inclui templates de exemplo e auto-detecção de formato. |
|
||
| **💬 Chat Tester** | Envie requisições reais pelo OmniRoute e veja a viagem completa: sua entrada, a requisição traduzida, a resposta do provedor, e a resposta traduzida de volta. Inestimável para validar roteamento de combos. |
|
||
| **🧪 Test Bench** | Modo de teste em lote — defina múltiplos casos de teste com diferentes entradas e saídas esperadas, execute todos de uma vez, e compare resultados entre provedores e modelos. |
|
||
| **📱 Live Monitor** | Monitoramento de requisições em tempo real — acompanhe requisições entrando conforme fluem pelo OmniRoute, veja traduções de formato acontecendo ao vivo, e identifique problemas instantaneamente. |
|
||
|
||
**Acesso:** Dashboard → Translator (barra lateral)
|
||
|
||
### 💾 Cloud Sync
|
||
|
||
- Sincronize provedores, combos e configurações entre dispositivos
|
||
- Sincronização automática em background
|
||
- Armazenamento criptografado seguro
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🧪 Avaliações (Evals)
|
||
|
||
OmniRoute inclui um framework de avaliação integrado para testar a qualidade de respostas de LLM contra um conjunto golden. Acesse via **Analytics → Evals** no dashboard.
|
||
|
||
### Conjunto Golden Integrado
|
||
|
||
O "OmniRoute Golden Set" pré-carregado contém 10 casos de teste cobrindo:
|
||
|
||
- Saudações, matemática, geografia, geração de código
|
||
- Conformidade de formato JSON, tradução, markdown
|
||
- Recusa de segurança (conteúdo prejudicial), contagem, lógica booleana
|
||
|
||
### Estratégias de Avaliação
|
||
|
||
| Estratégia | Descrição | Exemplo |
|
||
| ---------- | ---------------------------------------------- | -------------------------------- |
|
||
| `exact` | Saída deve corresponder exatamente | `"4"` |
|
||
| `contains` | Saída deve conter substring (case-insensitive) | `"Paris"` |
|
||
| `regex` | Saída deve corresponder ao padrão regex | `"1.*2.*3"` |
|
||
| `custom` | Função JS customizada retorna true/false | `(output) => output.length > 10` |
|
||
|
||
---
|
||
|
||
## 📖 Guia de Configuração
|
||
|
||
<details>
|
||
<summary><b>💳 Provedores por Assinatura</b></summary>
|
||
|
||
### Claude Code (Pro/Max)
|
||
|
||
```bash
|
||
Dashboard → Provedores → Conectar Claude Code
|
||
→ Login OAuth → Renovação automática de token
|
||
→ Rastreamento de cota 5h + semanal
|
||
|
||
Modelos:
|
||
cc/claude-opus-4-6
|
||
cc/claude-sonnet-4-5-20250929
|
||
cc/claude-haiku-4-5-20251001
|
||
```
|
||
|
||
**Dica Pro:** Use Opus para tarefas complexas, Sonnet para velocidade. OmniRoute rastreia cota por modelo!
|
||
|
||
### OpenAI Codex (Plus/Pro)
|
||
|
||
```bash
|
||
Dashboard → Provedores → Conectar Codex
|
||
→ Login OAuth (porta 1455)
|
||
→ Reset 5h + semanal
|
||
|
||
Modelos:
|
||
cx/gpt-5.2-codex
|
||
cx/gpt-5.1-codex-max
|
||
```
|
||
|
||
### Gemini CLI (GRATUITO 180K/mês!)
|
||
|
||
```bash
|
||
Dashboard → Provedores → Conectar Gemini CLI
|
||
→ Google OAuth
|
||
→ 180K completions/mês + 1K/dia
|
||
|
||
Modelos:
|
||
gc/gemini-3-flash-preview
|
||
gc/gemini-2.5-pro
|
||
```
|
||
|
||
**Melhor Valor:** Tier gratuito enorme! Use antes dos tiers pagos.
|
||
|
||
### GitHub Copilot
|
||
|
||
```bash
|
||
Dashboard → Provedores → Conectar GitHub
|
||
→ OAuth via GitHub
|
||
→ Reset mensal (1º do mês)
|
||
|
||
Modelos:
|
||
gh/gpt-5
|
||
gh/claude-4.5-sonnet
|
||
gh/gemini-3-pro
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔑 Provedores por API Key</b></summary>
|
||
|
||
### NVIDIA NIM (GRATUITO 1000 créditos!)
|
||
|
||
1. Cadastre-se: [build.nvidia.com](https://build.nvidia.com)
|
||
2. Obtenha API key gratuita (1000 créditos de inferência incluídos)
|
||
3. Dashboard → Adicionar Provedor → NVIDIA NIM:
|
||
- API Key: `nvapi-your-key`
|
||
|
||
**Modelos:** `nvidia/llama-3.3-70b-instruct`, `nvidia/mistral-7b-instruct`, e 50+ mais
|
||
|
||
**Dica Pro:** API compatível com OpenAI — funciona perfeitamente com a tradução de formato do OmniRoute!
|
||
|
||
### DeepSeek
|
||
|
||
1. Cadastre-se: [platform.deepseek.com](https://platform.deepseek.com)
|
||
2. Obtenha API key
|
||
3. Dashboard → Adicionar Provedor → DeepSeek
|
||
|
||
**Modelos:** `deepseek/deepseek-chat`, `deepseek/deepseek-coder`
|
||
|
||
### Groq (Tier Gratuito Disponível!)
|
||
|
||
1. Cadastre-se: [console.groq.com](https://console.groq.com)
|
||
2. Obtenha API key (tier gratuito incluído)
|
||
3. Dashboard → Adicionar Provedor → Groq
|
||
|
||
**Modelos:** `groq/llama-3.3-70b`, `groq/mixtral-8x7b`
|
||
|
||
**Dica Pro:** Inferência ultra-rápida — melhor para programação em tempo real!
|
||
|
||
### OpenRouter (100+ Modelos)
|
||
|
||
1. Cadastre-se: [openrouter.ai](https://openrouter.ai)
|
||
2. Obtenha API key
|
||
3. Dashboard → Adicionar Provedor → OpenRouter
|
||
|
||
**Modelos:** Acesse 100+ modelos de todos os principais provedores através de uma única API key.
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>💰 Provedores Baratos (Backup)</b></summary>
|
||
|
||
### GLM-4.7 (Reset diário, $0.6/1M)
|
||
|
||
1. Cadastre-se: [Zhipu AI](https://open.bigmodel.cn/)
|
||
2. Obtenha API key do Plano Coding
|
||
3. Dashboard → Adicionar API Key:
|
||
- Provedor: `glm`
|
||
- API Key: `your-key`
|
||
|
||
**Use:** `glm/glm-4.7`
|
||
|
||
**Dica Pro:** Plano Coding oferece 3× cota a 1/7 do custo! Reset diário 10:00 AM.
|
||
|
||
### MiniMax M2.1 (Reset 5h, $0.20/1M)
|
||
|
||
1. Cadastre-se: [MiniMax](https://www.minimax.io/)
|
||
2. Obtenha API key
|
||
3. Dashboard → Adicionar API Key
|
||
|
||
**Use:** `minimax/MiniMax-M2.1`
|
||
|
||
**Dica Pro:** Opção mais barata para contexto longo (1M tokens)!
|
||
|
||
### Kimi K2 ($9/mês fixo)
|
||
|
||
1. Assine: [Moonshot AI](https://platform.moonshot.ai/)
|
||
2. Obtenha API key
|
||
3. Dashboard → Adicionar API Key
|
||
|
||
**Use:** `kimi/kimi-latest`
|
||
|
||
**Dica Pro:** $9/mês fixo por 10M tokens = $0.90/1M de custo efetivo!
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🆓 Provedores GRATUITOS (Backup de Emergência)</b></summary>
|
||
|
||
### iFlow (8 modelos GRATUITOS)
|
||
|
||
```bash
|
||
Dashboard → Conectar iFlow
|
||
→ Login OAuth iFlow
|
||
→ Uso ilimitado
|
||
|
||
Modelos:
|
||
if/kimi-k2-thinking
|
||
if/qwen3-coder-plus
|
||
if/glm-4.7
|
||
if/minimax-m2
|
||
if/deepseek-r1
|
||
```
|
||
|
||
### Qwen (3 modelos GRATUITOS)
|
||
|
||
```bash
|
||
Dashboard → Conectar Qwen
|
||
→ Autorização por código de dispositivo
|
||
→ Uso ilimitado
|
||
|
||
Modelos:
|
||
qw/qwen3-coder-plus
|
||
qw/qwen3-coder-flash
|
||
```
|
||
|
||
### Kiro (Claude GRATUITO)
|
||
|
||
```bash
|
||
Dashboard → Conectar Kiro
|
||
→ AWS Builder ID ou Google/GitHub
|
||
→ Uso ilimitado
|
||
|
||
Modelos:
|
||
kr/claude-sonnet-4.5
|
||
kr/claude-haiku-4.5
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🎨 Criar Combos</b></summary>
|
||
|
||
### Exemplo 1: Maximizar Assinatura → Backup Barato
|
||
|
||
```
|
||
Dashboard → Combos → Criar Novo
|
||
|
||
Nome: premium-coding
|
||
Modelos:
|
||
1. cc/claude-opus-4-6 (Assinatura primária)
|
||
2. glm/glm-4.7 (Backup barato, $0.6/1M)
|
||
3. minimax/MiniMax-M2.1 (Fallback mais barato, $0.20/1M)
|
||
|
||
Use na CLI: premium-coding
|
||
```
|
||
|
||
### Exemplo 2: Somente Gratuito (Custo Zero)
|
||
|
||
```
|
||
Nome: free-combo
|
||
Modelos:
|
||
1. gc/gemini-3-flash-preview (180K grátis/mês)
|
||
2. if/kimi-k2-thinking (ilimitado)
|
||
3. qw/qwen3-coder-plus (ilimitado)
|
||
|
||
Custo: $0 para sempre!
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔧 Integração CLI</b></summary>
|
||
|
||
### Cursor IDE
|
||
|
||
```
|
||
Configurações → Modelos → Avançado:
|
||
OpenAI API Base URL: http://localhost:20128/v1
|
||
OpenAI API Key: [do dashboard OmniRoute]
|
||
Model: cc/claude-opus-4-6
|
||
```
|
||
|
||
### Claude Code
|
||
|
||
Use a página **CLI Tools** no dashboard para configuração em um clique, ou edite `~/.claude/settings.json` manualmente.
|
||
|
||
### Codex CLI
|
||
|
||
```bash
|
||
export OPENAI_BASE_URL="http://localhost:20128"
|
||
export OPENAI_API_KEY="your-omniroute-api-key"
|
||
|
||
codex "your prompt"
|
||
```
|
||
|
||
### OpenClaw
|
||
|
||
**Opção 1 — Dashboard (recomendado):**
|
||
|
||
```
|
||
Dashboard → CLI Tools → OpenClaw → Selecionar Modelo → Aplicar
|
||
```
|
||
|
||
**Opção 2 — Manual:** Edite `~/.openclaw/openclaw.json`:
|
||
|
||
```json
|
||
{
|
||
"models": {
|
||
"providers": {
|
||
"omniroute": {
|
||
"baseUrl": "http://127.0.0.1:20128/v1",
|
||
"apiKey": "sk_omniroute",
|
||
"api": "openai-completions"
|
||
}
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
> **Nota:** OpenClaw funciona apenas com OmniRoute local. Use `127.0.0.1` em vez de `localhost` para evitar problemas de resolução IPv6.
|
||
|
||
### Cline / Continue / RooCode
|
||
|
||
```
|
||
Configurações → Configuração de API:
|
||
Provedor: OpenAI Compatible
|
||
Base URL: http://localhost:20128/v1
|
||
API Key: [do dashboard OmniRoute]
|
||
Model: if/kimi-k2-thinking
|
||
```
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🐛 Solução de Problemas
|
||
|
||
<details>
|
||
<summary><b>Clique para expandir o guia de solução de problemas</b></summary>
|
||
|
||
**"Language model did not provide messages"**
|
||
|
||
- Cota do provedor esgotada → Verifique o rastreador de cota no dashboard
|
||
- Solução: Use combo com fallback ou mude para tier mais barato
|
||
|
||
**Rate limiting**
|
||
|
||
- Cota de assinatura esgotada → Fallback para GLM/MiniMax
|
||
- Adicione combo: `cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking`
|
||
|
||
**Token OAuth expirado**
|
||
|
||
- Renovado automaticamente pelo OmniRoute
|
||
- Se persistir: Dashboard → Provedor → Reconectar
|
||
|
||
**Custos altos**
|
||
|
||
- Verifique estatísticas de uso em Dashboard → Custos
|
||
- Mude modelo primário para GLM/MiniMax
|
||
- Use tier gratuito (Gemini CLI, iFlow) para tarefas não-críticas
|
||
|
||
**Dashboard abre na porta errada**
|
||
|
||
- Defina `PORT=20128` e `NEXT_PUBLIC_BASE_URL=http://localhost:20128`
|
||
|
||
**Erros de cloud sync**
|
||
|
||
- Verifique se `BASE_URL` aponta para sua instância em execução
|
||
- Verifique se `CLOUD_URL` aponta para seu endpoint cloud esperado
|
||
- Mantenha valores `NEXT_PUBLIC_*` alinhados com valores do servidor
|
||
|
||
**Primeiro login não funciona**
|
||
|
||
- Verifique `INITIAL_PASSWORD` no `.env`
|
||
- Se não definido, senha padrão é `123456`
|
||
|
||
**Sem logs de requisição**
|
||
|
||
- Defina `ENABLE_REQUEST_LOGS=true` no `.env`
|
||
|
||
**Teste de conexão mostra "Invalid" para provedores compatíveis com OpenAI**
|
||
|
||
- Muitos provedores não expõem endpoint `/models`
|
||
- OmniRoute v1.0.6+ inclui validação via chat completions como fallback
|
||
- Certifique-se de que a base URL inclui sufixo `/v1`
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🛠️
|
||
|
||
- **Runtime**: Node.js 20+
|
||
- **Linguagem**: TypeScript 5.9 — **100% TypeScript** em `src/` e `open-sse/` (v1.0.6)
|
||
- **Framework**: Next.js 16 + React 19 + Tailwind CSS 4
|
||
- **Banco de Dados**: LowDB (JSON) + SQLite (estado do domínio + logs de proxy)
|
||
- **Streaming**: Server-Sent Events (SSE)
|
||
- **Auth**: OAuth 2.0 (PKCE) + JWT + API Keys
|
||
- **Testes**: Node.js test runner (368+ testes unitários)
|
||
- **CI/CD**: GitHub Actions (publicação automática npm + Docker Hub no release)
|
||
- **Website**: [omniroute.online](https://omniroute.online)
|
||
- **Pacote**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute)
|
||
- **Docker**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute)
|
||
- **Resiliência**: Circuit breaker, backoff exponencial, anti-thundering herd, spoofing TLS
|
||
|
||
---
|
||
|
||
## 📖 Documentação
|
||
|
||
| Documento | Descrição |
|
||
| ----------------------------------------------- | ------------------------------------------------- |
|
||
| [Guia do Usuário](docs/USER_GUIDE.md) | Provedores, combos, integração CLI, deploy |
|
||
| [Referência da API](docs/API_REFERENCE.md) | Todos os endpoints com exemplos |
|
||
| [Solução de Problemas](docs/TROUBLESHOOTING.md) | Problemas comuns e soluções |
|
||
| [Arquitetura](docs/ARCHITECTURE.md) | Arquitetura do sistema e internos |
|
||
| [Contribuindo](CONTRIBUTING.md) | Setup de desenvolvimento e diretrizes |
|
||
| [Spec OpenAPI](docs/openapi.yaml) | Especificação OpenAPI 3.0 |
|
||
| [Política de Segurança](SECURITY.md) | Reportar vulnerabilidades e práticas de segurança |
|
||
| [Deploy em VM](docs/VM_DEPLOYMENT_GUIDE.md) | Guia completo: VM + nginx + Cloudflare |
|
||
| [Galeria de Features](docs/FEATURES.md) | Tour visual do dashboard com screenshots |
|
||
|
||
### 📸 Preview do Dashboard
|
||
|
||
<details>
|
||
<summary><b>Clique para ver screenshots do dashboard</b></summary>
|
||
|
||
| Página | Screenshot |
|
||
| ----------------- | ------------------------------------------------- |
|
||
| **Provedores** |  |
|
||
| **Combos** |  |
|
||
| **Analytics** |  |
|
||
| **Saúde** |  |
|
||
| **Tradutor** |  |
|
||
| **Configurações** |  |
|
||
| **CLI Tools** |  |
|
||
| **Logs de Uso** |  |
|
||
| **Endpoint** |  |
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🗺️
|
||
|
||
O OmniRoute tem **210+ funcionalidades planejadas** em múltiplas fases de desenvolvimento. Áreas principais:
|
||
|
||
| Categoria | Features Planejadas | Destaques |
|
||
| -------------------------------- | ------------------- | --------------------------------------------------------------------------- |
|
||
| 🧠 **Roteamento e Inteligência** | 25+ | Roteamento por menor latência, roteamento por tags, pré-verificação de cota |
|
||
| 🔒 **Segurança e Compliance** | 20+ | Hardening SSRF, cloaking de credenciais, rate-limit por endpoint |
|
||
| 📊 **Observabilidade** | 15+ | Integração OpenTelemetry, monitoramento de cota em tempo real |
|
||
| 🔄 **Integrações** | 20+ | Registro dinâmico de modelos, cooldowns de provedor |
|
||
| ⚡ **Performance** | 15+ | Cache dupla camada, prompt cache, response cache, batch API |
|
||
| 🌐 **Ecossistema** | 10+ | WebSocket API, config hot-reload, modo comercial |
|
||
|
||
### 🔜 Em Breve
|
||
|
||
- 🔗 **Integração com OpenCode** — Suporte nativo como provider para a IDE OpenCode
|
||
- 🔗 **Integração com TRAE** — Suporte completo ao framework de desenvolvimento TRAE
|
||
- 📦 **Batch API** — Processamento assíncrono em lote para requisições em massa
|
||
- 🎯 **Roteamento por Tags** — Roteamento de requisições baseado em tags personalizadas
|
||
- 💰 **Estratégia de Menor Custo** — Seleção automática do provedor mais barato
|
||
|
||
> 📝 Especificações completas de features disponíveis em [`docs/new-features/`](docs/new-features/) (217 specs detalhadas)
|
||
|
||
---
|
||
|
||
## 👥 Contribuidores
|
||
|
||
[](https://github.com/diegosouzapw/OmniRoute/graphs/contributors)
|
||
|
||
### Como Contribuir
|
||
|
||
1. Faça fork do repositório
|
||
2. Crie sua branch de funcionalidade (`git checkout -b feature/amazing-feature`)
|
||
3. Faça commit das suas alterações (`git commit -m 'Add amazing feature'`)
|
||
4. Faça push para a branch (`git push origin feature/amazing-feature`)
|
||
5. Abra um Pull Request
|
||
|
||
Veja [CONTRIBUTING.md](CONTRIBUTING.md) para diretrizes detalhadas.
|
||
|
||
### Lançando uma Nova Versão
|
||
|
||
```bash
|
||
# Crie um release — publicação no npm acontece automaticamente
|
||
gh release create v1.0.6 --title "v1.0.6" --generate-notes
|
||
```
|
||
|
||
---
|
||
|
||
## 📊 Histórico de Stars
|
||
|
||
## Stargazers over time
|
||
|
||
## [](https://starchart.cc/diegosouzapw/OmniRoute)
|
||
|
||
## 🙏 Agradecimentos
|
||
|
||
Agradecimento especial a **[9router](https://github.com/decolua/9router)** por **[decolua](https://github.com/decolua)** — o projeto original que inspirou este fork. OmniRoute se baseia nessa fundação incrível com funcionalidades adicionais, APIs multi-modal e uma reescrita completa em TypeScript.
|
||
|
||
Agradecimento especial a **[CLIProxyAPI](https://github.com/router-for-me/CLIProxyAPI)** — a implementação original em Go que inspirou esta adaptação em JavaScript.
|
||
|
||
---
|
||
|
||
## 📄 Licença
|
||
|
||
Licença MIT - veja [LICENSE](LICENSE) para detalhes.
|
||
|
||
---
|
||
|
||
<div align="center">
|
||
<sub>Feito com ❤️ para desenvolvedores que programam 24/7</sub>
|
||
<br/>
|
||
<sub><a href="https://omniroute.online">omniroute.online</a></sub>
|
||
</div>
|