mirror of
https://github.com/diegosouzapw/OmniRoute.git
synced 2026-05-05 01:32:35 +00:00
star-history.com embeds are often cached and slow to update. The new starchart.cc widget (variant=adaptive) renders better on both light and dark themes and updates in real-time. Updated: README.md + 29 i18n locale READMEs
1428 lines
63 KiB
Markdown
1428 lines
63 KiB
Markdown
<div align="center">
|
||
<img src="./docs/screenshots/MainOmniRoute.png" alt="OmniRoute Dashboard" width="800"/>
|
||
|
||
# 🚀 OmniRoute — Il Gateway IA Gratuito
|
||
|
||
### Non smettere mai di programmare. Routing intelligente verso **modelli IA GRATUITI e economici** con fallback automatico.
|
||
|
||
_Il tuo proxy API universale — un endpoint, 36+ provider, zero downtime._
|
||
|
||
**Chat Completions • Embeddings • Generazione Immagini • Audio • Reranking • 100% TypeScript**
|
||
|
||
---
|
||
|
||
### 🚀 New in v2.0.9+ — Playground, CLI Fingerprints & ACP
|
||
|
||
| Feature | What It Does |
|
||
| ------------------------------------------ | --------------------------------------------------------------------------------------------------------------------------------------------- |
|
||
| 🎮 **Model Playground** | Dashboard page to test any model directly — provider/model/endpoint selectors, Monaco Editor, streaming, abort, timing |
|
||
| 🔏 **CLI Fingerprint Matching** | Per-provider header/body ordering to match native CLI signatures — toggle per provider in Settings > Security. **Your proxy IP is preserved** |
|
||
| 🤝 **ACP Support (Agent Client Protocol)** | CLI agent discovery (Codex, Claude, Goose, Gemini CLI, OpenClaw), process spawner, `/api/acp/agents` endpoint |
|
||
| 🤖 **ACP Agents Dashboard** | Debug > Agents page — grid of 14 agents with install status, version, custom agent form for any CLI tool |
|
||
| 🔧 **Custom Model `apiFormat` Routing** | Custom models with `apiFormat: "responses"` now correctly route to the Responses API translator |
|
||
| 🏢 **Codex Workspace Isolation** | Multiple Codex workspaces per email — OAuth correctly separates connections by workspace ID |
|
||
| 🔄 **Electron Auto-Update** | Desktop app checks for updates + auto-install on restart |
|
||
|
||
### 🤖 Provider IA gratuito per i tuoi agenti di programmazione preferiti
|
||
|
||
_Connetti qualsiasi IDE o strumento CLI con IA tramite OmniRoute — gateway API gratuito per programmazione illimitata._
|
||
|
||
<table>
|
||
<tr>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/cline/cline">
|
||
<img src="./public/providers/openclaw.png" alt="OpenClaw" width="48"/><br/>
|
||
<b>OpenClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 205K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/HKUDS/nanobot">
|
||
<img src="./public/providers/nanobot.png" alt="NanoBot" width="48"/><br/>
|
||
<b>NanoBot</b>
|
||
</a><br/>
|
||
<sub>⭐ 20.9K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/sipeed/picoclaw">
|
||
<img src="./public/providers/picoclaw.jpg" alt="PicoClaw" width="48"/><br/>
|
||
<b>PicoClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 14.6K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/zeroclaw-labs/zeroclaw">
|
||
<img src="./public/providers/zeroclaw.png" alt="ZeroClaw" width="48"/><br/>
|
||
<b>ZeroClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 9.9K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/nearai/ironclaw">
|
||
<img src="./public/providers/ironclaw.png" alt="IronClaw" width="48"/><br/>
|
||
<b>IronClaw</b>
|
||
</a><br/>
|
||
<sub>⭐ 2.1K</sub>
|
||
</td>
|
||
</tr>
|
||
<tr>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/anomalyco/opencode">
|
||
<img src="./public/providers/opencode.svg" alt="OpenCode" width="48"/><br/>
|
||
<b>OpenCode</b>
|
||
</a><br/>
|
||
<sub>⭐ 106K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/openai/codex">
|
||
<img src="./public/providers/codex.png" alt="Codex CLI" width="48"/><br/>
|
||
<b>Codex CLI</b>
|
||
</a><br/>
|
||
<sub>⭐ 60.8K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/anthropics/claude-code">
|
||
<img src="./public/providers/claude.png" alt="Claude Code" width="48"/><br/>
|
||
<b>Claude Code</b>
|
||
</a><br/>
|
||
<sub>⭐ 67.3K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/google-gemini/gemini-cli">
|
||
<img src="./public/providers/gemini-cli.png" alt="Gemini CLI" width="48"/><br/>
|
||
<b>Gemini CLI</b>
|
||
</a><br/>
|
||
<sub>⭐ 94.7K</sub>
|
||
</td>
|
||
<td align="center" width="110">
|
||
<a href="https://github.com/Kilo-Org/kilocode">
|
||
<img src="./public/providers/kilocode.png" alt="Kilo Code" width="48"/><br/>
|
||
<b>Kilo Code</b>
|
||
</a><br/>
|
||
<sub>⭐ 15.5K</sub>
|
||
</td>
|
||
</tr>
|
||
</table>
|
||
|
||
<sub>📡 Tutti gli agenti si connettono via <code>http://localhost:20128/v1</code> o <code>http://cloud.omniroute.online/v1</code> — una configurazione, modelli e quota illimitati</sub>
|
||
|
||
---
|
||
|
||
[](https://www.npmjs.com/package/omniroute)
|
||
[](https://hub.docker.com/r/diegosouzapw/omniroute)
|
||
[](https://github.com/diegosouzapw/OmniRoute/blob/main/LICENSE)
|
||
[](https://omniroute.online)
|
||
[](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
|
||
|
||
[🌐 Sito Web](https://omniroute.online) • [🚀 Avvio Rapido](#-avvio-rapido) • [💡 Funzionalità](#-funzionalità-principali) • [📖 Docs](#-documentazione) • [💰 Prezzi](#-panoramica-prezzi)
|
||
|
||
🌐 **Available in:** 🇺🇸 [English](../../README.md) | 🇧🇷 [Português (Brasil)](../pt-BR/README.md) | 🇪🇸 [Español](../es/README.md) | 🇫🇷 [Français](../fr/README.md) | 🇮🇹 [Italiano](../it/README.md) | 🇷🇺 [Русский](../ru/README.md) | 🇨🇳 [中文 (简体)](../zh-CN/README.md) | 🇩🇪 [Deutsch](../de/README.md) | 🇮🇳 [हिन्दी](../in/README.md) | 🇹🇭 [ไทย](../th/README.md) | 🇺🇦 [Українська](../uk-UA/README.md) | 🇸🇦 [العربية](../ar/README.md) | 🇯🇵 [日本語](../ja/README.md) | 🇻🇳 [Tiếng Việt](../vi/README.md) | 🇧🇬 [Български](../bg/README.md) | 🇩🇰 [Dansk](../da/README.md) | 🇫🇮 [Suomi](../fi/README.md) | 🇮🇱 [עברית](../he/README.md) | 🇭🇺 [Magyar](../hu/README.md) | 🇮🇩 [Bahasa Indonesia](../id/README.md) | 🇰🇷 [한국어](../ko/README.md) | 🇲🇾 [Bahasa Melayu](../ms/README.md) | 🇳🇱 [Nederlands](../nl/README.md) | 🇳🇴 [Norsk](../no/README.md) | 🇵🇹 [Português (Portugal)](../pt/README.md) | 🇷🇴 [Română](../ro/README.md) | 🇵🇱 [Polski](../pl/README.md) | 🇸🇰 [Slovenčina](../sk/README.md) | 🇸🇪 [Svenska](../sv/README.md) | 🇵🇭 [Filipino](../phi/README.md)
|
||
|
||
</div>
|
||
|
||
---
|
||
|
||
## 🖼️
|
||
|
||
<div align="center">
|
||
<img src="./docs/screenshots/MainOmniRoute.png" alt="OmniRoute" width="800"/>
|
||
</div>
|
||
|
||
---
|
||
|
||
## 📸
|
||
|
||
<details>
|
||
<summary><b>...</b></summary>
|
||
|
||
| # | # |
|
||
| ----- | ---------------------------------------- |
|
||
| **1** |  |
|
||
| **2** |  |
|
||
| **3** |  |
|
||
| **4** |  |
|
||
| **5** |  |
|
||
| **6** |  |
|
||
| **7** |  |
|
||
| **8** |  |
|
||
| **9** |  |
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🤔 Perché OmniRoute?
|
||
|
||
**Smetti di sprecare soldi e di sbattere contro i limiti:**
|
||
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> La quota dell'abbonamento scade inutilizzata ogni mese
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> I limiti di rate ti fermano nel mezzo della programmazione
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> API costose ($20-50/mese per provider)
|
||
- <img src="https://img.shields.io/badge/✗-e74c3c?style=flat-square" height="16"/> Cambio manuale tra provider
|
||
|
||
**OmniRoute risolve tutto questo:**
|
||
|
||
- ✅ **Massimizza gli abbonamenti** — Traccia le quote, usa tutto prima del reset
|
||
- ✅ **Fallback automatico** — Abbonamento → API Key → Economico → Gratuito, zero downtime
|
||
- ✅ **Multi-account** — Round-robin tra account per provider
|
||
- ✅ **Universale** — Funziona con Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, qualsiasi strumento CLI
|
||
|
||
---
|
||
|
||
## 📧 Supporto
|
||
|
||
> 💬 **Unisciti alla nostra community!** [Gruppo WhatsApp](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) — Ottieni aiuto, condividi consigli e rimani aggiornato.
|
||
|
||
- **Sito Web**: [omniroute.online](https://omniroute.online)
|
||
- **GitHub**: [github.com/diegosouzapw/OmniRoute](https://github.com/diegosouzapw/OmniRoute)
|
||
- **Issues**: [github.com/diegosouzapw/OmniRoute/issues](https://github.com/diegosouzapw/OmniRoute/issues)
|
||
- **WhatsApp**: [Gruppo della comunità](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
|
||
- **WhatsApp**: [Gruppo della comunità](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
|
||
- **Progetto Originale**: [9router di decolua](https://github.com/decolua/9router)
|
||
|
||
---
|
||
|
||
## 🔄 Come Funziona
|
||
|
||
```
|
||
┌─────────────┐
|
||
│ Il tuo CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
|
||
│ Tool │
|
||
└──────┬──────┘
|
||
│ http://localhost:20128/v1
|
||
↓
|
||
┌─────────────────────────────────────────┐
|
||
│ OmniRoute (Router Intelligente) │
|
||
│ • Traduzione formato (OpenAI ↔ Claude) │
|
||
│ • Tracciamento quote + Embeddings + Immagini │
|
||
│ • Rinnovo automatico dei token │
|
||
└──────┬──────────────────────────────────┘
|
||
│
|
||
├─→ [Tier 1: ABBONAMENTO] Claude Code, Codex, Gemini CLI
|
||
│ ↓ quota esaurita
|
||
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, ecc.
|
||
│ ↓ limite budget
|
||
├─→ [Tier 3: ECONOMICO] GLM ($0.6/1M), MiniMax ($0.2/1M)
|
||
│ ↓ limite budget
|
||
└─→ [Tier 4: GRATUITO] iFlow, Qwen, Kiro (illimitato)
|
||
|
||
Risultato: Non smettere mai di programmare, costo minimo
|
||
```
|
||
|
||
---
|
||
|
||
## 🎯 Cosa risolve OmniRoute: 30 punti critici reali e casi d'uso
|
||
|
||
> **Ogni sviluppatore che utilizza strumenti di intelligenza artificiale affronta questi problemi quotidianamente.** OmniRoute è stato creato per risolverli tutti: dai superamenti dei costi ai blocchi regionali, dai flussi OAuth interrotti alle operazioni di protocollo e all'osservabilità aziendale.
|
||
|
||
<details>
|
||
<summary><b>💸 1. "Pago un abbonamento costoso ma vengo comunque interrotto dai limiti"</b></summary>
|
||
|
||
Gli sviluppatori pagano $ 20-200 al mese per Claude Pro, Codex Pro o GitHub Copilot. Anche pagando, la quota ha un tetto: 5 ore di utilizzo, limiti settimanali o limiti di tariffa al minuto. A metà sessione di codifica, il provider smette di rispondere e lo sviluppatore perde flusso e produttività.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Fallback intelligente a 4 livelli**: se la quota dell'abbonamento si esaurisce, reindirizza automaticamente alla chiave API → Economico → Gratuito senza alcun intervento manuale
|
||
- **Monitoraggio delle quote in tempo reale**: mostra il consumo di token in tempo reale con il conto alla rovescia ripristinato (5 ore, giornaliero, settimanale)
|
||
- **Supporto multi-account**: più account per fornitore con round robin automatico: quando uno si esaurisce, passa a quello successivo
|
||
- **Combo personalizzate** — Catene di fallback personalizzabili con 6 strategie di bilanciamento (fill-first, round-robin, P2C, casuale, meno utilizzato, ottimizzato in termini di costi)
|
||
- **Quote aziendali Codex**: monitoraggio delle quote dello spazio di lavoro aziendale/team direttamente nella dashboard
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔌 2. "Devo utilizzare più provider ma ognuno ha un'API diversa"</b></summary>
|
||
|
||
OpenAI utilizza un formato, Claude (Anthropic) ne utilizza un altro, Gemini ancora un altro. Se uno sviluppatore desidera testare modelli di fornitori diversi o eseguire il fallback tra di loro, deve riconfigurare gli SDK, modificare gli endpoint e gestire formati incompatibili. I provider personalizzati (FriendLI, NIM) hanno endpoint del modello non standard.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Endpoint unificato**: un singolo `http://localhost:20128/v1` funge da proxy per tutti gli oltre 36 provider
|
||
- **Traduzione del formato** — Automatica e trasparente: OpenAI ↔ Claude ↔ Gemini ↔ API di risposta
|
||
- **Sanitizzazione della risposta**: rimuove i campi non standard (`x_groq`, `usage_breakdown`, `service_tier`) che interrompono OpenAI SDK v1.83+
|
||
- **Normalizzazione del ruolo**: converte `developer` → `system` per provider non OpenAI; `system` → `user` per GLM/ERNIE
|
||
- **Think Tag Extraction** — Estrae i blocchi `<think>` da modelli come DeepSeek R1 in `reasoning_content` standardizzati
|
||
- **Uscita strutturata per Gemini** — `json_schema` → `responseMimeType`/`responseSchema` conversione automatica
|
||
- **`stream` per impostazione predefinita è `false`** — Si allinea con le specifiche OpenAI, evitando SSE imprevisti negli SDK Python/Rust/Go
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌐 3. "Il mio fornitore di intelligenza artificiale blocca la mia regione/paese"</b></summary>
|
||
|
||
Provider come OpenAI/Codex bloccano l'accesso da determinate regioni geografiche. Gli utenti ricevono errori come `unsupported_country_region_territory` durante le connessioni OAuth e API. Ciò è particolarmente frustrante per gli sviluppatori dei paesi in via di sviluppo.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Configurazione proxy a 3 livelli**: proxy configurabile a 3 livelli: globale (tutto il traffico), per provider (un solo provider) e per connessione/chiave
|
||
- **Badge proxy con codice colore** — Indicatori visivi: 🟢 proxy globale, 🟡 proxy provider, 🔵 proxy di connessione, che mostra sempre l'IP
|
||
- **Scambio di token OAuth tramite proxy**: anche il flusso OAuth passa attraverso il proxy, risolvendo `unsupported_country_region_territory`
|
||
- **Test di connessione tramite proxy**: i test di connessione utilizzano il proxy configurato (non più bypass diretto)
|
||
- **Supporto SOCKS5**: supporto completo del proxy SOCKS5 per il routing in uscita
|
||
- **Spoofing dell'impronta digitale TLS**: impronta digitale TLS simile a un browser tramite `wreq-js` per bypassare il rilevamento dei bot
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🆓 4. "Voglio usare l'intelligenza artificiale per programmare ma non ho soldi"</b></summary>
|
||
|
||
Non tutti possono pagare $ 20-200 al mese per gli abbonamenti AI. Studenti, sviluppatori provenienti da paesi emergenti, hobbisti e liberi professionisti hanno bisogno di accedere a modelli di qualità a costo zero.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Fornitori del livello gratuito integrati**: supporto nativo per fornitori gratuiti al 100%: iFlow (8 modelli illimitati), Qwen (3 modelli illimitati), Kiro (Claude gratis), Gemini CLI (180.000/mese gratuiti)
|
||
- **Ollama Cloud** — Cloud-hosted Ollama models at `api.ollama.com` with free "Light usage" tier; use `ollamacloud/<model>` prefix
|
||
- **Combo solo gratuiti** — Catena `gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus` = $ 0/mese senza tempi di inattività
|
||
- **Crediti gratuiti NVIDIA NIM**: 1000 crediti gratuiti integrati
|
||
- **Strategia di ottimizzazione dei costi**: strategia di routing che sceglie automaticamente il fornitore più economico disponibile
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔒 5. "Devo proteggere il mio gateway AI da accessi non autorizzati"</b></summary>
|
||
|
||
Quando si espone un gateway AI alla rete (LAN, VPS, Docker), chiunque abbia l'indirizzo può consumare i token/la quota dello sviluppatore. Senza protezione, le API sono vulnerabili ad usi impropri, tempestive iniezioni e abusi.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Gestione delle chiavi API**: generazione, rotazione e ambito per provider con una pagina `/dashboard/api-manager` dedicata
|
||
- **Autorizzazioni a livello di modello**: limita le chiavi API a modelli specifici (`openai/*`, modelli con caratteri jolly), con l'interruttore Consenti tutto/Limita
|
||
- **API Endpoint Protection**: richiede una chiave per `/v1/models` e blocca provider specifici dall'elenco
|
||
- **Auth Guard + Protezione CSRF**: tutti i percorsi del dashboard protetti con middleware `withAuth` + token CSRF
|
||
- **Rate Limiter**: limitazione della velocità per IP con finestre configurabili
|
||
- **Filtro IP**: lista consentita/lista bloccata per il controllo degli accessi
|
||
- **Prompt Injection Guard**: sanificazione contro modelli di prompt dannosi
|
||
- **Crittografia AES-256-GCM**: credenziali crittografate a riposo
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🛑 6. "Il mio provider è andato in tilt e ho perso il flusso di codifica"</b></summary>
|
||
|
||
I fornitori di intelligenza artificiale possono diventare instabili, restituire errori 5xx o raggiungere limiti di velocità temporanei. Se uno sviluppatore dipende da un singolo fornitore, viene interrotto. Senza interruttori automatici, tentativi ripetuti possono bloccare l'applicazione.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Interruttore automatico per provider**: apertura/chiusura automatica con soglie e raffreddamento configurabili (chiuso/aperto/semiaperto)
|
||
- **Backoff esponenziale**: ritardi progressivi tra i tentativi
|
||
- **Anti-Thundering Herd** — Mutex + protezione semaforo contro tempeste di tentativi simultanei
|
||
- **Catene di fallback combinate**: se il fornitore primario fallisce, cade automaticamente nella catena senza alcun intervento
|
||
- **Combo Circuit Breaker**: disabilita automaticamente i provider in errore all'interno di una catena combinata
|
||
- **Dashboard integrità**: monitoraggio del tempo di attività, stati degli interruttori automatici, blocchi, statistiche della cache, latenza p50/p95/p99
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔧 7. "Configurare ogni strumento AI è noioso e ripetitivo"</b></summary>
|
||
|
||
Gli sviluppatori utilizzano Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Ogni strumento necessita di una configurazione diversa (endpoint API, chiave, modello). La riconfigurazione quando si cambia fornitore o modello è una perdita di tempo.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Dashboard degli strumenti CLI**: pagina dedicata con configurazione con un clic per Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
|
||
- **GitHub Copilot Config Generator**: genera `chatLanguageModels.json` per VS Code con selezione di modelli in blocco
|
||
- **Procedura guidata di onboarding**: configurazione guidata in 4 passaggi per gli utenti alle prime armi
|
||
- **Un endpoint, tutti i modelli**: configura `http://localhost:20128/v1` una volta, accedi a oltre 36 provider
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔑 8. "Gestire token OAuth da più provider è un inferno"</b></summary>
|
||
|
||
Claude Code, Codex, Gemini CLI, Copilot: utilizzano tutti OAuth 2.0 con token in scadenza. Gli sviluppatori devono autenticarsi nuovamente costantemente, gestire `client_secret is missing`, `redirect_uri_mismatch` e errori sui server remoti. OAuth su LAN/VPS è particolarmente problematico.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Aggiornamento automatico dei token**: i token OAuth si aggiornano in background prima della scadenza
|
||
- **OAuth 2.0 (PKCE) integrato**: flusso automatico per Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
|
||
- **OAuth multi-account**: account multipli per provider tramite estrazione di token JWT/ID
|
||
- **OAuth LAN/Correzione remota**: rilevamento IP privato per `redirect_uri` + modalità URL manuale per server remoti
|
||
- **OAuth Behind Nginx**: utilizza `window.location.origin` per la compatibilità con proxy inverso
|
||
- **Guida OAuth remota**: guida passo passo per le credenziali Google Cloud su VPS/Docker
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📊 9. "Non so quanto sto spendendo né dove"</b></summary>
|
||
|
||
Gli sviluppatori utilizzano più fornitori a pagamento ma non hanno una visione unificata della spesa. Ogni fornitore ha il proprio dashboard di fatturazione, ma non esiste una visualizzazione consolidata. I costi imprevisti possono accumularsi.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Dashboard di analisi dei costi**: monitoraggio dei costi per token e gestione del budget per fornitore
|
||
- **Limiti di budget per livello**: massimale di spesa per livello che attiva il fallback automatico
|
||
- **Configurazione dei prezzi per modello**: prezzi configurabili per modello
|
||
- **Statistiche di utilizzo per chiave API**: conteggio delle richieste e timestamp dell'ultimo utilizzo per chiave
|
||
- **Dashboard di analisi**: schede statistiche, grafico di utilizzo del modello, tabella dei fornitori con percentuali di successo e latenza
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🐛 10. "Non riesco a diagnosticare errori e problemi nelle chiamate AI"</b></summary>
|
||
|
||
Quando una chiamata fallisce, lo sviluppatore non sa se si trattava di un limite di velocità, di un token scaduto, di un formato errato o di un errore del provider. Registri frammentati su diversi terminali. Senza osservabilità, il debug è un processo per tentativi ed errori.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Dashboard dei registri unificati**: 4 schede: registri delle richieste, registri del proxy, registri di controllo, console
|
||
- **Visualizzatore log della console**: visualizzatore in stile terminale in tempo reale con livelli codificati a colori, scorrimento automatico, ricerca, filtro
|
||
- **Registri proxy SQLite**: registri persistenti che sopravvivono ai riavvii del server
|
||
- **Translator Playground** — 4 modalità di debug: Playground (traduzione del formato), Chat Tester (andata e ritorno), Test Bench (batch), Live Monitor (in tempo reale)
|
||
- **Telemetria richiesta**: latenza p50/p95/p99 + traccia X-Request-Id
|
||
- **Registrazione basata su file con rotazione**: l'interceptor della console acquisisce tutto nel registro JSON con rotazione basata sulle dimensioni
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🏗️ 11. "L'implementazione e la manutenzione del gateway sono complesse"</b></summary>
|
||
|
||
L'installazione, la configurazione e la manutenzione di un proxy AI in diversi ambienti (locale, VPS, Docker, cloud) richiedono molto lavoro. Problemi come percorsi codificati, `EACCES` nelle directory, conflitti di porte e build multipiattaforma aggiungono attrito.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Installazione globale npm** — `npm install -g omniroute && omniroute` — completata
|
||
- **Docker multipiattaforma** — AMD64 + ARM64 nativo (Apple Silicon, AWS Graviton, Raspberry Pi)
|
||
- **Docker Compose Profiles** — `base` (senza strumenti CLI) e `cli` (con Claude Code, Codex, OpenClaw)
|
||
- **App desktop Electron**: app nativa per Windows/macOS/Linux con barra delle applicazioni, avvio automatico, modalità offline
|
||
- **Modalità porta divisa**: API e dashboard su porte separate per scenari avanzati (proxy inverso, rete di contenitori)
|
||
- **Cloud Sync**: configura la sincronizzazione tra dispositivi tramite Cloudflare Workers
|
||
- **Backup DB**: backup, ripristino, esportazione e importazione automatici di tutte le impostazioni
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌍 12. "L'interfaccia è solo inglese e il mio team non parla inglese"</b></summary>
|
||
|
||
I team nei paesi non anglofoni, soprattutto in America Latina, Asia ed Europa, hanno difficoltà con le interfacce solo in inglese. Le barriere linguistiche riducono l'adozione e aumentano gli errori di configurazione.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Dashboard i18n — 30 lingue** — Tutti gli oltre 500 tasti tradotti tra cui arabo, bulgaro, danese, tedesco, spagnolo, finlandese, francese, ebraico, hindi, ungherese, indonesiano, italiano, giapponese, coreano, malese, olandese, norvegese, polacco, portoghese (PT/BR), rumeno, russo, slovacco, svedese, tailandese, ucraino, vietnamita, cinese, filippino, inglese
|
||
- **Supporto RTL**: supporto da destra a sinistra per arabo ed ebraico
|
||
- **README multilingue**: 30 traduzioni complete di documentazione
|
||
- **Selettore lingua**: icona del globo nell'intestazione per la commutazione in tempo reale
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔄 13. "Ho bisogno di qualcosa di più della semplice chat: ho bisogno di incorporamenti, immagini, audio"</b></summary>
|
||
|
||
L'intelligenza artificiale non è solo il completamento della chat. Gli sviluppatori devono generare immagini, trascrivere audio, creare incorporamenti per RAG, riclassificare i documenti e moderare i contenuti. Ogni API ha un endpoint e un formato diversi.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Incorporamenti** — `/v1/embeddings` con 6 fornitori e oltre 9 modelli
|
||
- **Generazione di immagini** — `/v1/images/generations` con 10 provider e oltre 20 modelli (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
|
||
- **Da testo a video** — `/v1/videos/generations` — ComfyUI (AnimateDiff, SVD) e SD WebUI
|
||
- **Trasformazione testo in musica** — `/v1/music/generations` — ComfyUI (Stable Audio Open, MusicGen)
|
||
- **Trascrizione audio** — `/v1/audio/transcriptions` — Whisper + Nvidia NIM, HuggingFace, Qwen3
|
||
- **Sintesi vocale** — `/v1/audio/speech` — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT, + fornitori esistenti
|
||
- **Moderazioni** — `/v1/moderations` — Controlli di sicurezza dei contenuti
|
||
- **Riclassificazione** — `/v1/rerank`: riclassificazione della pertinenza del documento
|
||
- **API di risposta**: supporto `/v1/responses` completo per Codex
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧪 14. "Non ho modo di testare e confrontare la qualità tra i modelli"</b></summary>
|
||
|
||
Gli sviluppatori vogliono sapere quale modello è il migliore per il loro caso d'uso (codice, traduzione, ragionamento), ma il confronto manuale è lento. Non esistono strumenti di valutazione integrati.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Valutazioni LLM**: test Golden Set con 10 casi precaricati che coprono saluti, matematica, geografia, generazione di codice, conformità JSON, traduzione, ribasso, rifiuto di sicurezza
|
||
- **4 strategie di corrispondenza** — `exact`, `contains`, `regex`, `custom` (funzione JS)
|
||
- **Translator Playground Test Bench**: test in batch con input multipli e output previsti, confronto tra provider
|
||
- **Chat Tester**: andata e ritorno completo con rendering della risposta visiva
|
||
- **Live Monitor**: flusso in tempo reale di tutte le richieste che passano attraverso il proxy
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📈 15. "Ho bisogno di scalare senza perdere prestazioni"</b></summary>
|
||
|
||
Man mano che il volume delle richieste cresce, senza la memorizzazione nella cache le stesse domande generano costi duplicati. Senza idempotenza, le richieste duplicate sprecano elaborazione. I limiti tariffari per fornitore devono essere rispettati.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Cache semantica**: la cache a due livelli (firma + semantica) riduce costi e latenza
|
||
- **Idempotenza richiesta**: finestra di deduplicazione di 5 secondi per richieste identiche
|
||
- **Rilevamento del limite di velocità**: RPM per provider, gap minimo e monitoraggio simultaneo massimo
|
||
- **Limiti di velocità modificabili**: impostazioni predefinite configurabili in Impostazioni → Resilienza con persistenza
|
||
- **Cache di convalida della chiave API**: cache a 3 livelli per prestazioni di produzione
|
||
- **Dashboard integrità con telemetria**: latenza p50/p95/p99, statistiche cache, tempo di attività
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🤖 16. "Voglio controllare il comportamento del modello a livello globale"</b></summary>
|
||
|
||
Sviluppatori che desiderano tutte le risposte in una lingua specifica, con un tono specifico o che desiderano limitare i token di ragionamento. Configurarlo in ogni strumento/richiesta non è pratico.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- **Inserimento prompt di sistema**: prompt globale applicato a tutte le richieste
|
||
- **Thinking Budget Validation**: controllo dell'allocazione dei token tramite ragionamento per richiesta (passthrough, automatico, personalizzato, adattivo)
|
||
- **6 Strategie di routing**: strategie globali che determinano la modalità di distribuzione delle richieste
|
||
- **Wildcard Router**: i modelli `provider/*` instradano dinamicamente a qualsiasi provider
|
||
- **Abilita/Disabilita combo**: attiva/disattiva le combo direttamente dalla dashboard
|
||
- **Attiva/disattiva provider**: attiva/disattiva tutte le connessioni per un provider con un clic
|
||
- **Fornitori bloccati**: esclude fornitori specifici dall'elenco `/v1/models`
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧰 17. "Ho bisogno degli strumenti MCP come funzionalità di prodotto di prima classe"</b></summary>
|
||
|
||
Molti gateway AI espongono MCP solo come dettaglio di implementazione nascosto. I team hanno bisogno di un livello operativo visibile e gestibile.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- MCP viene visualizzato nella navigazione del dashboard e nella scheda del protocollo dell'endpoint
|
||
- Pagina di gestione MCP dedicata con processo, strumenti, ambiti e audit
|
||
- Avvio rapido integrato per `omniroute --mcp` e onboarding del client
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧠 18. "Ho bisogno dell'orchestrazione A2A con percorsi di attività di sincronizzazione + streaming"</b></summary>
|
||
|
||
I flussi di lavoro degli agenti necessitano sia di risposte dirette che di esecuzione in streaming di lunga durata con controllo del ciclo di vita.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Endpoint A2A JSON-RPC (`POST /a2a`) con `message/send` e `message/stream`
|
||
- Streaming SSE con propagazione dello stato terminale
|
||
- API del ciclo di vita delle attività per `tasks/get` e `tasks/cancel`
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🛰️ 19. "Ho bisogno dello stato reale del processo MCP, non di uno stato indovinato"</b></summary>
|
||
|
||
I team operativi devono sapere se MCP è effettivamente attivo, non solo se un'API è raggiungibile.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- File heartbeat di runtime con PID, timestamp, trasporto, conteggio strumenti e modalità ambito
|
||
- API di stato MCP che combina battito cardiaco + attività recente
|
||
- Schede di stato dell'interfaccia utente per l'aggiornamento di processo/tempo di attività/battito cardiaco
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📋 20. "Ho bisogno dell'esecuzione verificabile dello strumento MCP"</b></summary>
|
||
|
||
Quando gli strumenti modificano la configurazione o attivano azioni operative, i team necessitano di tracciabilità forense.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Registrazione di controllo supportata da SQLite per le chiamate allo strumento MCP
|
||
- Filtri per strumento, successo/fallimento, chiave API e impaginazione
|
||
- Tabella di controllo della dashboard + endpoint statistici per l'automazione
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔐 21. "Ho bisogno di autorizzazioni MCP con ambito per integrazione"</b></summary>
|
||
|
||
Client diversi dovrebbero avere accesso con privilegi minimi alle categorie di strumenti.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- 9 ambiti MCP granulari per l'accesso controllato agli strumenti
|
||
- Applicazione dell'ambito e visibilità nell'interfaccia utente di gestione MCP
|
||
- Postura predefinita sicura per gli strumenti operativi
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>⚙️ 22. "Ho bisogno di controlli operativi senza ridistribuirmi"</b></summary>
|
||
|
||
I team necessitano di rapidi cambiamenti di runtime durante incidenti o eventi di costo.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Cambia l'attivazione combinata direttamente dalla dashboard MCP
|
||
- Applicare profili di resilienza da pacchetti di policy predefiniti
|
||
- Ripristinare lo stato dell'interruttore dallo stesso pannello operativo
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔄 23. "Ho bisogno di visibilità e cancellazione del ciclo di vita delle attività A2A in tempo reale"</b></summary>
|
||
|
||
Senza visibilità del ciclo di vita, gli incidenti relativi alle attività diventano difficili da valutare.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Elenco/filtro delle attività per stato/competenza con impaginazione
|
||
- Esamina i metadati, gli eventi e gli artefatti delle attività
|
||
- Endpoint di annullamento dell'attività e azione dell'interfaccia utente con conferma
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🌊 24. "Ho bisogno di metriche di flusso attive per il carico A2A"</b></summary>
|
||
|
||
I flussi di lavoro in streaming richiedono informazioni operative sulla concorrenza e sulle connessioni live.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Contatori di flussi attivi integrati nello stato A2A
|
||
- Timestamp dell'ultima attività e conteggi per stato
|
||
- Schede dashboard A2A per il monitoraggio delle operazioni in tempo reale
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🪪 25. "Ho bisogno del rilevamento degli agenti standard per i clienti"</b></summary>
|
||
|
||
I client e gli agenti di orchestrazione esterni necessitano di metadati leggibili dal computer per l'onboarding.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Carta Agente esposta a `/.well-known/agent.json`
|
||
- Capacità e competenze mostrate nell'interfaccia utente di gestione
|
||
- L'API di stato A2A include metadati di rilevamento per l'automazione
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧭 26. "Ho bisogno della rilevabilità del protocollo nella UX del prodotto"</b></summary>
|
||
|
||
Se gli utenti non riescono a scoprire le superfici del protocollo, l'adozione e la qualità del supporto diminuiscono.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Voci della barra laterale per MCP e A2A
|
||
- Scheda Protocolli della pagina Endpoint con avvio rapido e stato
|
||
- Collegamenti dalla panoramica alle dashboard di gestione dedicate
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🧪 27. "Ho bisogno della convalida del protocollo end-to-end con clienti reali"</b></summary>
|
||
|
||
I test simulati non sono sufficienti per verificare la compatibilità del protocollo prima del rilascio.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Suite E2E che avvia l'app e utilizza il trasporto client SDK MCP reale
|
||
- Test client A2A per i flussi di rilevamento, invio, streaming, acquisizione e annullamento
|
||
- Effettuare un controllo incrociato delle asserzioni con l'audit MCP e le API delle attività A2A
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>📡 28. "Ho bisogno di osservabilità unificata su tutte le interfacce"</b></summary>
|
||
|
||
Suddividere l'osservabilità per protocollo crea punti ciechi e un MTTR più lungo.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Dashboard/registri/analisi unificati in un unico prodotto
|
||
- Salute + audit + richiesta di telemetria su livelli OpenAI, MCP e A2A
|
||
- API operative per stato e automazione
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>💼 29. "Ho bisogno di un runtime per proxy + strumenti + orchestrazione agente"</b></summary>
|
||
|
||
L'esecuzione di numerosi servizi separati aumenta i costi operativi e le modalità di guasto.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Proxy compatibile con OpenAI, server MCP e server A2A in uno stack
|
||
- Autenticazione condivisa, resilienza, archivio dati e osservabilità
|
||
- Modello politico coerente su tutte le superfici di interazione
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🚀 30. "Ho bisogno di spedire flussi di lavoro di agenti senza la proliferazione del codice adesivo"</b></summary>
|
||
|
||
I team perdono velocità quando uniscono più servizi e script ad hoc.
|
||
|
||
**Come OmniRoute risolve il problema:**
|
||
|
||
- Strategia endpoint unificata per clienti e agenti
|
||
- Interfacce utente di gestione del protocollo integrate e percorsi di convalida del fumo
|
||
- Fondamenti pronti per la produzione (sicurezza, registrazione, resilienza, backup)
|
||
|
||
</details>
|
||
|
||
### Playbook di esempio (casi d'uso integrati)
|
||
|
||
**Playbook A: massimizza l'abbonamento a pagamento + backup economico**
|
||
|
||
```txt
|
||
Combo: "maximize-claude"
|
||
1. cc/claude-opus-4-6
|
||
2. glm/glm-4.7
|
||
3. if/kimi-k2-thinking
|
||
|
||
Monthly cost: $20 + small backup spend
|
||
Outcome: higher quality, near-zero interruption
|
||
```
|
||
|
||
**Playbook B: stack di codifica a costo zero**
|
||
|
||
```txt
|
||
Combo: "free-forever"
|
||
1. gc/gemini-3-flash
|
||
2. if/kimi-k2-thinking
|
||
3. qw/qwen3-coder-plus
|
||
|
||
Monthly cost: $0
|
||
Outcome: stable free coding workflow
|
||
```
|
||
|
||
**Playbook C: catena di fallback sempre attiva 24 ore su 24, 7 giorni su 7**
|
||
|
||
```txt
|
||
Combo: "always-on"
|
||
1. cc/claude-opus-4-6
|
||
2. cx/gpt-5.2-codex
|
||
3. glm/glm-4.7
|
||
4. minimax/MiniMax-M2.1
|
||
5. if/kimi-k2-thinking
|
||
|
||
Outcome: deep fallback depth for deadline-critical workloads
|
||
```
|
||
|
||
**Playbook D: operazioni dell'agente con MCP + A2A**
|
||
|
||
```txt
|
||
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
|
||
2) Run A2A tasks via `message/send` and `message/stream`
|
||
3) Observe via /dashboard/mcp and /dashboard/a2a
|
||
4) Control incidents with resilience profile + task cancellation
|
||
```
|
||
|
||
---
|
||
|
||
## ⚡ Avvio Rapido
|
||
|
||
**1. Installa globalmente:**
|
||
|
||
```bash
|
||
npm install -g omniroute
|
||
omniroute
|
||
```
|
||
|
||
🎉 La Dashboard si apre su `http://localhost:20128`
|
||
|
||
| Comando | Descrizione |
|
||
| ----------------------- | ------------------------------------------- |
|
||
| `omniroute` | Avviare il server (porta predefinita 20128) |
|
||
| `omniroute --port 3000` | Usare una porta personalizzata |
|
||
| `omniroute --no-open` | Non aprire il browser automaticamente |
|
||
| `omniroute --help` | Mostrare l'aiuto |
|
||
|
||
**2. Connetti un provider GRATUITO:**
|
||
|
||
Dashboard → Provider → Connetti **Claude Code** o **Antigravity** → Login OAuth → Fatto!
|
||
|
||
**3. Usa nel tuo strumento CLI:**
|
||
|
||
```
|
||
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Impostazioni:
|
||
Endpoint: http://localhost:20128/v1
|
||
API Key: [copia dalla dashboard]
|
||
Model: if/kimi-k2-thinking
|
||
```
|
||
|
||
**Tutto qui!** Inizia a programmare con modelli IA GRATUITI.
|
||
|
||
**Alternativa — eseguire dal codice sorgente:**
|
||
|
||
```bash
|
||
cp .env.example .env
|
||
npm install
|
||
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev
|
||
```
|
||
|
||
---
|
||
|
||
## 🐳 Docker
|
||
|
||
OmniRoute è disponibile come immagine Docker pubblica su [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute).
|
||
|
||
**Avvio rapido:**
|
||
|
||
```bash
|
||
docker run -d \
|
||
--name omniroute \
|
||
--restart unless-stopped \
|
||
-p 20128:20128 \
|
||
-v omniroute-data:/app/data \
|
||
diegosouzapw/omniroute:latest
|
||
```
|
||
|
||
**Con file di ambiente:**
|
||
|
||
```bash
|
||
# Copia e modifica il .env prima
|
||
cp .env.example .env
|
||
|
||
docker run -d \
|
||
--name omniroute \
|
||
--restart unless-stopped \
|
||
--env-file .env \
|
||
-p 20128:20128 \
|
||
-v omniroute-data:/app/data \
|
||
diegosouzapw/omniroute:latest
|
||
```
|
||
|
||
**Con Docker Compose:**
|
||
|
||
```bash
|
||
# Profilo base (senza strumenti CLI)
|
||
docker compose --profile base up -d
|
||
|
||
# Profilo CLI (Claude Code, Codex, OpenClaw integrati)
|
||
docker compose --profile cli up -d
|
||
```
|
||
|
||
| Immagine | Tag | Dimensione | Descrizione |
|
||
| ------------------------ | -------- | ---------- | ----------------------- |
|
||
| `diegosouzapw/omniroute` | `latest` | ~250MB | Ultima versione stabile |
|
||
| `diegosouzapw/omniroute` | `1.0.6` | ~250MB | Versione attuale |
|
||
|
||
---
|
||
|
||
---
|
||
|
||
## 🖥️
|
||
|
||
> 🆕 **NEW!** OmniRoute is now available as a **native desktop application** for Windows, macOS, and Linux.
|
||
|
||
- 🖥️ **Native Window** — Dedicated app window with system tray integration
|
||
- 🔄 **Auto-Start** — Launch OmniRoute on system login
|
||
- 🔔 **Native Notifications** — Get alerts for quota exhaustion or provider issues
|
||
- ⚡ **One-Click Install** — NSIS (Windows), DMG (macOS), AppImage (Linux)
|
||
- 🌐 **Offline Mode** — Works fully offline with bundled server
|
||
|
||
```bash
|
||
npm run electron:dev # Development mode
|
||
npm run electron:build # Current platform
|
||
npm run electron:build:win # Windows (.exe)
|
||
npm run electron:build:mac # macOS (.dmg)
|
||
npm run electron:build:linux # Linux (.AppImage)
|
||
```
|
||
|
||
📖 Full documentation: [`electron/README.md`](electron/README.md)
|
||
|
||
---
|
||
|
||
## 💰 Panoramica Prezzi
|
||
|
||
| Tier | Provider | Costo | Reset Quota | Ideale Per |
|
||
| ------------------ | ----------------- | ---------------------------- | --------------------- | ------------------------------- |
|
||
| **💳 ABBONAMENTO** | Claude Code (Pro) | $20/mese | 5h + settimanale | Già abbonato |
|
||
| | Codex (Plus/Pro) | $20-200/mese | 5h + settimanale | Utenti OpenAI |
|
||
| | Gemini CLI | **GRATUITO** | 180K/mese + 1K/giorno | Tutti! |
|
||
| | GitHub Copilot | $10-19/mese | Mensile | Utenti GitHub |
|
||
| **🔑 API KEY** | NVIDIA NIM | **GRATUITO** (1000 crediti) | Una tantum | Test gratuiti |
|
||
| | DeepSeek | A consumo | Nessuno | Miglior rapporto qualità-prezzo |
|
||
| | Groq | Livello gratis + a pagamento | Limitato | Inferenza ultra-veloce |
|
||
| | xAI (Grok) | A consumo | Nessuno | Modelli Grok |
|
||
| | Mistral | Livello gratis + a pagamento | Limitato | IA Europea |
|
||
| | OpenRouter | A consumo | Nessuno | 100+ modelli |
|
||
| **💰 ECONOMICO** | GLM-4.7 | $0.6/1M | Giornaliero 10h | Backup economico |
|
||
| | MiniMax M2.1 | $0.2/1M | Rotativo 5h | Opzione più economica |
|
||
| | Kimi K2 | $9/mese fisso | 10M token/mese | Costo prevedibile |
|
||
| **🆓 GRATUITO** | iFlow | $0 | Illimitato | 8 modelli gratuiti |
|
||
| | Qwen | $0 | Illimitato | 3 modelli gratuiti |
|
||
| | Kiro | $0 | Illimitato | Claude gratuito |
|
||
|
||
**💡 Consiglio Pro:** Inizia con Gemini CLI (180K gratis/mese) + iFlow (illimitato gratis) = $0 di costo!
|
||
|
||
---
|
||
|
||
## 💡 Funzionalità Principali
|
||
|
||
### 🧠 Routing & Intelligenza
|
||
|
||
| Funzionalità | Cosa Fa |
|
||
| ---------------------------------------- | ----------------------------------------------------------------------------- |
|
||
| 🎯 **Fallback intelligente 4 livelli** | Auto-routing: Abbonamento → API Key → Economico → Gratuito |
|
||
| 📊 **Tracciamento quote in tempo reale** | Conteggio token live + countdown reset per provider |
|
||
| 🔄 **Traduzione di formato** | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro trasparente |
|
||
| 👥 **Supporto multi-account** | Account multipli per provider con selezione intelligente |
|
||
| 🔄 **Rinnovo automatico dei token** | I token OAuth si rinnovano automaticamente con retry |
|
||
| 🎨 **Combo personalizzati** | 6 strategie: fill-first, round-robin, p2c, random, least-used, cost-optimized |
|
||
| 🧩 **Modelli personalizzati** | Aggiungi qualsiasi ID modello a qualsiasi provider |
|
||
| 🌐 **Router wildcard** | Instrada pattern `provider/*` verso qualsiasi provider dinamicamente |
|
||
| 🧠 **Budget di ragionamento** | Modalità passthrough, auto, custom e adaptive per modelli di ragionamento |
|
||
| 🔀 **Model Aliases** | Auto-forward deprecated model IDs to current replacements (built-in + custom) |
|
||
| ⚡ **Background Degradation** | Auto-route background tasks (titles, summaries) to cheaper models |
|
||
| 💬 **Iniezione System Prompt** | System prompt globale applicato a tutte le richieste |
|
||
| 📄 **API Responses** | Supporto completo per OpenAI Responses API (`/v1/responses`) per Codex |
|
||
|
||
### 🎵 API Multi-modali
|
||
|
||
| Funzionalità | Cosa Fa |
|
||
| --------------------------- | ---------------------------------------------------- |
|
||
| 🖼️ **Generazione immagini** | `/v1/images/generations` — 4 provider, 9+ modelli |
|
||
| 📐 **Embeddings** | `/v1/embeddings` — 6 provider, 9+ modelli |
|
||
| 🎤 **Trascrizione audio** | `/v1/audio/transcriptions` — Compatibile Whisper |
|
||
| 🔊 **Testo a voce** | `/v1/audio/speech` — Sintesi audio multi-provider |
|
||
| 🛡️ **Moderazioni** | `/v1/moderations` — Controlli di sicurezza |
|
||
| 🔀 **Reranking** | `/v1/rerank` — Riclassificazione rilevanza documenti |
|
||
|
||
### 🛡️ Resilienza & Sicurezza
|
||
|
||
| Funzionalità | Cosa Fa |
|
||
| ------------------------------- | -------------------------------------------------------------------------------------- |
|
||
| 🔌 **Circuit Breaker** | Apertura/chiusura auto per provider con soglie configurabili |
|
||
| 🎯 **Endpoint-Aware Models** | Custom models declare supported endpoints + API format |
|
||
| 🛡️ **Anti-Thundering Herd** | Mutex + semaforo rate-limit per provider con API key |
|
||
| 🧠 **Cache semantica** | Cache a due livelli (firma + semantica) riduce costi e latenza |
|
||
| ⚡ **Idempotenza richieste** | Finestra dedup 5s per richieste duplicate |
|
||
| 🔒 **Spoofing TLS Fingerprint** | Bypass rilevamento bot tramite wreq-js |
|
||
| 🔏 **CLI Fingerprint Matching** | Matches native CLI request signatures — **reduces ban risk while preserving proxy IP** |
|
||
| 🌐 **Filtro IP** | Allowlist/blocklist per controllo accesso API |
|
||
| 📊 **Rate limit modificabili** | RPM, gap minimo e concorrenza massima configurabili |
|
||
| 💾 **Rate Limit Persistence** | Learned limits survive restarts via SQLite with 60s debounce + 24h staleness |
|
||
| 🔄 **Token Refresh Resilience** | Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt |
|
||
|
||
### 📊 Osservabilità & Analytics
|
||
|
||
| Funzionalità | Cosa Fa |
|
||
| ----------------------------- | ------------------------------------------------------------ |
|
||
| 📝 **Log richieste** | Modalità debug con log completi richiesta/risposta |
|
||
| 💾 **Log SQLite** | Log proxy persistenti che sopravvivono ai riavvii |
|
||
| 📊 **Dashboard analytics** | Recharts: card statistiche, grafico uso, tabella provider |
|
||
| 📈 **Tracciamento progresso** | Eventi SSE di progresso opt-in per lo streaming |
|
||
| 🧪 **Valutazioni LLM** | Test con golden set e 4 strategie di corrispondenza |
|
||
| 🔍 **Telemetria richieste** | Aggregazione latenza p50/p95/p99 + tracciamento X-Request-Id |
|
||
| 📋 **Log + Quote** | Pagine dedicate per navigazione log e tracciamento quote |
|
||
| 🏥 **Dashboard salute** | Uptime, stati circuit breaker, lockout, statistiche cache |
|
||
| 💰 **Tracciamento costi** | Gestione budget + configurazione prezzi per modello |
|
||
|
||
### ☁️ Deploy & Sincronizzazione
|
||
|
||
| Funzionalità | Cosa Fa |
|
||
| -------------------------------- | -------------------------------------------------------------------------------- |
|
||
| 💾 **Cloud Sync** | Sincronizza impostazioni tra dispositivi via Cloudflare Workers |
|
||
| 🌐 **Deploy ovunque** | Localhost, VPS, Docker, Cloudflare Workers |
|
||
| 🔑 **Gestione API Key** | Genera, ruota e limita API key per provider |
|
||
| 🧙 **Assistente configurazione** | Setup guidato in 4 passaggi per nuovi utenti |
|
||
| 🔧 **Dashboard CLI Tools** | Configurazione con un clic per Claude, Codex, Cline, OpenClaw, Kilo, Antigravity |
|
||
| 🔄 **Backup DB** | Backup e ripristino automatici di tutte le impostazioni |
|
||
|
||
<details>
|
||
<summary><b>📖 Dettagli funzionalità</b></summary>
|
||
|
||
### 🎯 Fallback intelligente 4 livelli
|
||
|
||
Crea combo con fallback automatico:
|
||
|
||
```
|
||
Combo: "my-coding-stack"
|
||
1. cc/claude-opus-4-6 (il tuo abbonamento)
|
||
2. nvidia/llama-3.3-70b (API NVIDIA gratuita)
|
||
3. glm/glm-4.7 (backup economico, $0.6/1M)
|
||
4. if/kimi-k2-thinking (fallback gratuito)
|
||
|
||
→ Cambia automaticamente quando la quota si esaurisce o si verificano errori
|
||
```
|
||
|
||
### 📊 Tracciamento quote in tempo reale
|
||
|
||
- Consumo token per provider
|
||
- Countdown reset (5 ore, giornaliero, settimanale)
|
||
- Stima dei costi per livelli a pagamento
|
||
- Report spese mensili
|
||
|
||
### 🔄 Traduzione di formato
|
||
|
||
Traduzione trasparente tra formati:
|
||
|
||
- **OpenAI** ↔ **Claude** ↔ **Gemini** ↔ **OpenAI Responses**
|
||
- Il tuo CLI invia in formato OpenAI → OmniRoute traduce → Il provider riceve il formato nativo
|
||
- Funziona con qualsiasi strumento che supporti endpoint OpenAI personalizzati
|
||
|
||
### 👥 Supporto multi-account
|
||
|
||
- Aggiungi account multipli per provider
|
||
- Round-robin automatico o routing per priorità
|
||
- Fallback all'account successivo quando la quota viene raggiunta
|
||
|
||
### 🔄 Rinnovo automatico dei token
|
||
|
||
- I token OAuth si rinnovano automaticamente prima della scadenza
|
||
- Nessuna necessità di ri-autenticazione manuale
|
||
- Esperienza trasparente su tutti i provider
|
||
|
||
### 🎨 Combo personalizzati
|
||
|
||
- Crea combinazioni di modelli illimitate
|
||
- 6 strategie: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized
|
||
- Condividi combo tra dispositivi con Cloud Sync
|
||
|
||
### 🏥 Dashboard salute
|
||
|
||
- Stato del sistema (uptime, versione, utilizzo memoria)
|
||
- Stati circuit breaker per provider (Closed/Open/Half-Open)
|
||
- Stato rate limit e lockout attivi
|
||
- Statistiche cache firme
|
||
- Telemetria latenza (p50/p95/p99) + cache prompt
|
||
- Reset salute con un clic
|
||
|
||
### 🔧 Playground del traduttore
|
||
|
||
- Debug, test e visualizzazione delle traduzioni di formato API
|
||
- Invia richieste e vedi come OmniRoute traduce tra formati dei provider
|
||
- Inestimabile per risolvere problemi di integrazione
|
||
|
||
### 💾 Cloud Sync
|
||
|
||
- Sincronizza provider, combo e impostazioni tra dispositivi
|
||
- Sincronizzazione in background automatica
|
||
- Archiviazione criptata sicura
|
||
|
||
</details>
|
||
|
||
## 🧪 Valutazioni (Evals)
|
||
|
||
OmniRoute include un framework di valutazione integrato per testare la qualità delle risposte LLM contro un golden set. Accesso via **Analytics → Evals** nella dashboard.
|
||
|
||
### Set integrato
|
||
|
||
Il "OmniRoute Golden Set" precaricato contiene 10 casi di test:
|
||
|
||
- Saluti, matematica, geografia, generazione codice
|
||
- Conformità formato JSON, traduzione, markdown
|
||
- Rifiuto sicurezza (contenuto nocivo), conteggio, logica booleana
|
||
|
||
### Strategie di valutazione
|
||
|
||
| Strategia | Descrizione | Esempio |
|
||
| ---------- | ---------------------------------------------------------- | -------------------------------- |
|
||
| `exact` | L'output deve corrispondere esattamente | `"4"` |
|
||
| `contains` | L'output deve contenere la sottostringa (case-insensitive) | `"Paris"` |
|
||
| `regex` | L'output deve corrispondere al pattern regex | `"1.*2.*3"` |
|
||
| `custom` | Funzione JS personalizzata restituisce true/false | `(output) => output.length > 10` |
|
||
|
||
---
|
||
|
||
## 📖 Guida alla Configurazione
|
||
|
||
<details>
|
||
<summary><b>💳 Provider per abbonamento</b></summary>
|
||
|
||
### Claude Code (Pro/Max)
|
||
|
||
```bash
|
||
Dashboard → Provider → Connetti Claude Code
|
||
→ Login OAuth → Rinnovo automatico token
|
||
→ Tracciamento quota 5h + settimanale
|
||
|
||
Modelli:
|
||
cc/claude-opus-4-6
|
||
cc/claude-sonnet-4-5-20250929
|
||
cc/claude-haiku-4-5-20251001
|
||
```
|
||
|
||
**Consiglio Pro:** Usa Opus per compiti complessi, Sonnet per velocità. OmniRoute traccia la quota per modello!
|
||
|
||
### OpenAI Codex (Plus/Pro)
|
||
|
||
```bash
|
||
Dashboard → Provider → Connetti Codex
|
||
→ Login OAuth (porta 1455)
|
||
→ Reset 5h + settimanale
|
||
|
||
Modelli:
|
||
cx/gpt-5.2-codex
|
||
cx/gpt-5.1-codex-max
|
||
```
|
||
|
||
### Gemini CLI (GRATUITO 180K/mese!)
|
||
|
||
```bash
|
||
Dashboard → Provider → Connetti Gemini CLI
|
||
→ Google OAuth
|
||
→ 180K completions/mese + 1K/giorno
|
||
|
||
Modelli:
|
||
gc/gemini-3-flash-preview
|
||
gc/gemini-2.5-pro
|
||
```
|
||
|
||
**Miglior valore:** Livello gratuito enorme! Usa prima dei livelli a pagamento.
|
||
|
||
### GitHub Copilot
|
||
|
||
```bash
|
||
Dashboard → Provider → Connetti GitHub
|
||
→ OAuth via GitHub
|
||
→ Reset mensile (1° del mese)
|
||
|
||
Modelli:
|
||
gh/gpt-5
|
||
gh/claude-4.5-sonnet
|
||
gh/gemini-3-pro
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔑 Provider per API Key</b></summary>
|
||
|
||
### NVIDIA NIM (GRATUITO 1000 crediti!)
|
||
|
||
1. Registrati: [build.nvidia.com](https://build.nvidia.com)
|
||
2. Ottieni una API key gratuita (1000 crediti di inferenza inclusi)
|
||
3. Dashboard → Aggiungi Provider → NVIDIA NIM:
|
||
- API Key: `nvapi-your-key`
|
||
|
||
**Modelli:** `nvidia/llama-3.3-70b-instruct`, `nvidia/mistral-7b-instruct` e 50+ altri
|
||
|
||
**Consiglio Pro:** API compatibile OpenAI — funziona perfettamente con la traduzione di formato di OmniRoute!
|
||
|
||
### DeepSeek
|
||
|
||
1. Registrati: [platform.deepseek.com](https://platform.deepseek.com)
|
||
2. Ottieni una API key
|
||
3. Dashboard → Aggiungi Provider → DeepSeek
|
||
|
||
**Modelli:** `deepseek/deepseek-chat`, `deepseek/deepseek-coder`
|
||
|
||
### Groq (Livello gratuito disponibile!)
|
||
|
||
1. Registrati: [console.groq.com](https://console.groq.com)
|
||
2. Ottieni una API key (livello gratuito incluso)
|
||
3. Dashboard → Aggiungi Provider → Groq
|
||
|
||
**Modelli:** `groq/llama-3.3-70b`, `groq/mixtral-8x7b`
|
||
|
||
**Consiglio Pro:** Inferenza ultra-veloce — ideale per programmazione in tempo reale!
|
||
|
||
### OpenRouter (100+ modelli)
|
||
|
||
1. Registrati: [openrouter.ai](https://openrouter.ai)
|
||
2. Ottieni una API key
|
||
3. Dashboard → Aggiungi Provider → OpenRouter
|
||
|
||
**Modelli:** Accesso a 100+ modelli da tutti i principali provider tramite una singola API key.
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>💰 Provider economici (Backup)</b></summary>
|
||
|
||
### GLM-4.7 (Reset giornaliero, $0.6/1M)
|
||
|
||
1. Registrati: [Zhipu AI](https://open.bigmodel.cn/)
|
||
2. Ottieni la API key dal Coding Plan
|
||
3. Dashboard → Aggiungi API Key:
|
||
- Provider: `glm`
|
||
- API Key: `your-key`
|
||
|
||
**Usa:** `glm/glm-4.7`
|
||
|
||
**Consiglio Pro:** Il Coding Plan offre 3× quota a 1/7 del costo! Reset giornaliero alle 10:00.
|
||
|
||
### MiniMax M2.1 (Reset 5h, $0.20/1M)
|
||
|
||
1. Registrati: [MiniMax](https://www.minimax.io/)
|
||
2. Ottieni una API key
|
||
3. Dashboard → Aggiungi API Key
|
||
|
||
**Usa:** `minimax/MiniMax-M2.1`
|
||
|
||
**Consiglio Pro:** L'opzione più economica per contesto lungo (1M token)!
|
||
|
||
### Kimi K2 ($9/mese fisso)
|
||
|
||
1. Abbonati: [Moonshot AI](https://platform.moonshot.ai/)
|
||
2. Ottieni una API key
|
||
3. Dashboard → Aggiungi API Key
|
||
|
||
**Usa:** `kimi/kimi-latest`
|
||
|
||
**Consiglio Pro:** $9/mese fisso per 10M token = $0.90/1M di costo effettivo!
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🆓 Provider GRATUITI (Backup d'emergenza)</b></summary>
|
||
|
||
### iFlow (8 modelli GRATUITI)
|
||
|
||
```bash
|
||
Dashboard → Connetti iFlow
|
||
→ Login OAuth iFlow
|
||
→ Utilizzo illimitato
|
||
|
||
Modelli:
|
||
if/kimi-k2-thinking
|
||
if/qwen3-coder-plus
|
||
if/glm-4.7
|
||
if/minimax-m2
|
||
if/deepseek-r1
|
||
```
|
||
|
||
### Qwen (3 modelli GRATUITI)
|
||
|
||
```bash
|
||
Dashboard → Connetti Qwen
|
||
→ Autorizzazione con codice dispositivo
|
||
→ Utilizzo illimitato
|
||
|
||
Modelli:
|
||
qw/qwen3-coder-plus
|
||
qw/qwen3-coder-flash
|
||
```
|
||
|
||
### Kiro (Claude GRATUITO)
|
||
|
||
```bash
|
||
Dashboard → Connetti Kiro
|
||
→ AWS Builder ID o Google/GitHub
|
||
→ Utilizzo illimitato
|
||
|
||
Modelli:
|
||
kr/claude-sonnet-4.5
|
||
kr/claude-haiku-4.5
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🎨 Creare combo</b></summary>
|
||
|
||
### Esempio 1: Massimizzare abbonamento → Backup economico
|
||
|
||
```
|
||
Dashboard → Combo → Crea nuovo
|
||
|
||
Nome: premium-coding
|
||
Modelli:
|
||
1. cc/claude-opus-4-6 (Abbonamento principale)
|
||
2. glm/glm-4.7 (Backup economico, $0.6/1M)
|
||
3. minimax/MiniMax-M2.1 (Fallback più economico, $0.20/1M)
|
||
|
||
Usa nel CLI: premium-coding
|
||
```
|
||
|
||
### Esempio 2: Solo gratuiti (Costo zero)
|
||
|
||
```
|
||
Nome: free-combo
|
||
Modelli:
|
||
1. gc/gemini-3-flash-preview (180K gratis/mese)
|
||
2. if/kimi-k2-thinking (illimitato)
|
||
3. qw/qwen3-coder-plus (illimitato)
|
||
|
||
Costo: $0 per sempre!
|
||
```
|
||
|
||
</details>
|
||
|
||
<details>
|
||
<summary><b>🔧 Integrazione CLI</b></summary>
|
||
|
||
### Cursor IDE
|
||
|
||
```
|
||
Impostazioni → Modelli → Avanzato:
|
||
OpenAI API Base URL: http://localhost:20128/v1
|
||
OpenAI API Key: [dalla dashboard OmniRoute]
|
||
Model: cc/claude-opus-4-6
|
||
```
|
||
|
||
### Claude Code
|
||
|
||
Usa la pagina **CLI Tools** nella dashboard per la configurazione con un clic, o modifica `~/.claude/settings.json` manualmente.
|
||
|
||
### Codex CLI
|
||
|
||
```bash
|
||
export OPENAI_BASE_URL="http://localhost:20128"
|
||
export OPENAI_API_KEY="your-omniroute-api-key"
|
||
|
||
codex "your prompt"
|
||
```
|
||
|
||
### OpenClaw
|
||
|
||
**Opzione 1 — Dashboard (consigliato):**
|
||
|
||
```
|
||
Dashboard → CLI Tools → OpenClaw → Seleziona Modello → Applica
|
||
```
|
||
|
||
**Opzione 2 — Manuale:** Modifica `~/.openclaw/openclaw.json`:
|
||
|
||
```json
|
||
{
|
||
"models": {
|
||
"providers": {
|
||
"omniroute": {
|
||
"baseUrl": "http://127.0.0.1:20128/v1",
|
||
"apiKey": "sk_omniroute",
|
||
"api": "openai-completions"
|
||
}
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
> **Nota:** OpenClaw funziona solo con OmniRoute locale. Usa `127.0.0.1` invece di `localhost` per evitare problemi di risoluzione IPv6.
|
||
|
||
### Cline / Continue / RooCode
|
||
|
||
```
|
||
Impostazioni → Configurazione API:
|
||
Provider: OpenAI Compatible
|
||
Base URL: http://localhost:20128/v1
|
||
API Key: [dalla dashboard OmniRoute]
|
||
Model: if/kimi-k2-thinking
|
||
```
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🐛 Risoluzione Problemi
|
||
|
||
<details>
|
||
<summary><b>Clicca per espandere la guida alla risoluzione problemi</b></summary>
|
||
|
||
**"Language model did not provide messages"**
|
||
|
||
- Quota del provider esaurita → Controlla il tracker quote nella dashboard
|
||
- Soluzione: Usa un combo con fallback o passa a un livello più economico
|
||
|
||
**Rate limiting**
|
||
|
||
- Quota abbonamento esaurita → Fallback a GLM/MiniMax
|
||
- Aggiungi combo: `cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking`
|
||
|
||
**Token OAuth scaduto**
|
||
|
||
- Rinnovato automaticamente da OmniRoute
|
||
- Se il problema persiste: Dashboard → Provider → Riconnetti
|
||
|
||
**Costi elevati**
|
||
|
||
- Controlla le statistiche di utilizzo in Dashboard → Costi
|
||
- Cambia il modello principale a GLM/MiniMax
|
||
- Usa il livello gratuito (Gemini CLI, iFlow) per compiti non critici
|
||
|
||
**La dashboard si apre sulla porta sbagliata**
|
||
|
||
- Imposta `PORT=20128` e `NEXT_PUBLIC_BASE_URL=http://localhost:20128`
|
||
|
||
**Errori cloud sync**
|
||
|
||
- Verifica che `BASE_URL` punti alla tua istanza in esecuzione
|
||
- Verifica che `CLOUD_URL` punti all'endpoint cloud previsto
|
||
- Mantieni i valori `NEXT_PUBLIC_*` allineati con i valori del server
|
||
|
||
**Il primo login non funziona**
|
||
|
||
- Controlla `INITIAL_PASSWORD` nel `.env`
|
||
- Se non impostata, la password predefinita è `123456`
|
||
|
||
**Nessun log delle richieste**
|
||
|
||
- Imposta `ENABLE_REQUEST_LOGS=true` nel `.env`
|
||
|
||
**Il test di connessione mostra "Invalid" per provider compatibili OpenAI**
|
||
|
||
- Molti provider non espongono l'endpoint `/models`
|
||
- OmniRoute v1.0.6+ include validazione fallback tramite chat completions
|
||
- Assicurati che la URL base includa il suffisso `/v1`
|
||
|
||
</details>
|
||
|
||
---
|
||
|
||
## 🛠️
|
||
|
||
- **Runtime**: Node.js 20+
|
||
- **Linguaggio**: TypeScript 5.9 — **100% TypeScript** in `src/` e `open-sse/` (v1.0.6)
|
||
- **Framework**: Next.js 16 + React 19 + Tailwind CSS 4
|
||
- **Database**: LowDB (JSON) + SQLite (stato dominio + log proxy)
|
||
- **Streaming**: Server-Sent Events (SSE)
|
||
- **Auth**: OAuth 2.0 (PKCE) + JWT + API Keys
|
||
- **Testing**: Node.js test runner (368+ test unitari)
|
||
- **CI/CD**: GitHub Actions (pubblicazione automatica npm + Docker Hub al rilascio)
|
||
- **Sito Web**: [omniroute.online](https://omniroute.online)
|
||
- **Pacchetto**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute)
|
||
- **Docker**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute)
|
||
- **Resilienza**: Circuit breaker, backoff esponenziale, anti-thundering herd, TLS spoofing
|
||
|
||
---
|
||
|
||
## 📖 Documentazione
|
||
|
||
| Documento | Descrizione |
|
||
| ----------------------------------------------- | -------------------------------------------------- |
|
||
| [Guida Utente](docs/USER_GUIDE.md) | Provider, combo, integrazione CLI, deploy |
|
||
| [Riferimento API](docs/API_REFERENCE.md) | Tutti gli endpoint con esempi |
|
||
| [Risoluzione Problemi](docs/TROUBLESHOOTING.md) | Problemi comuni e soluzioni |
|
||
| [Architettura](docs/ARCHITECTURE.md) | Architettura del sistema e dettagli interni |
|
||
| [Come Contribuire](CONTRIBUTING.md) | Setup di sviluppo e linee guida |
|
||
| [Spec OpenAPI](docs/openapi.yaml) | Specifica OpenAPI 3.0 |
|
||
| [Politica di Sicurezza](SECURITY.md) | Segnalazione vulnerabilità e pratiche di sicurezza |
|
||
|
||
---
|
||
|
||
## 🗺️
|
||
|
||
## 👥 Contributori
|
||
|
||
[](https://github.com/diegosouzapw/OmniRoute/graphs/contributors)
|
||
|
||
### Come Contribuire
|
||
|
||
1. Fai il fork del repository
|
||
2. Crea il tuo branch di funzionalità (`git checkout -b feature/amazing-feature`)
|
||
3. Fai il commit delle modifiche (`git commit -m 'Add amazing feature'`)
|
||
4. Fai il push al branch (`git push origin feature/amazing-feature`)
|
||
5. Apri una Pull Request
|
||
|
||
Consulta [CONTRIBUTING.md](CONTRIBUTING.md) per le linee guida dettagliate.
|
||
|
||
### Rilasciare una nuova versione
|
||
|
||
```bash
|
||
# Crea un rilascio — la pubblicazione npm avviene automaticamente
|
||
gh release create v1.0.6 --title "v1.0.6" --generate-notes
|
||
```
|
||
|
||
---
|
||
|
||
## 📊 Cronologia Stelle
|
||
|
||
## Stargazers over time
|
||
|
||
## [](https://starchart.cc/diegosouzapw/OmniRoute)
|
||
|
||
## 🙏 Ringraziamenti
|
||
|
||
Un ringraziamento speciale a **[9router](https://github.com/decolua/9router)** di **[decolua](https://github.com/decolua)** — il progetto originale che ha ispirato questo fork. OmniRoute si costruisce su quell'incredibile base con funzionalità aggiuntive, API multi-modali e una riscrittura completa in TypeScript.
|
||
|
||
Un ringraziamento speciale a **[CLIProxyAPI](https://github.com/router-for-me/CLIProxyAPI)** — l'implementazione originale in Go che ha ispirato questo porting in JavaScript.
|
||
|
||
---
|
||
|
||
## 📄 Licenza
|
||
|
||
Licenza MIT — vedi [LICENSE](LICENSE) per i dettagli.
|
||
|
||
---
|
||
|
||
<div align="center">
|
||
<sub>Fatto con ❤️ per gli sviluppatori che programmano 24/7</sub>
|
||
<br/>
|
||
<sub><a href="https://omniroute.online">omniroute.online</a></sub>
|
||
</div>
|