mirror of https://github.com/diegosouzapw/OmniRoute.git synced 2026-05-06 02:07:00 +00:00

diegosouzapw b84e79362e docs: sync v3.2.6 features across 30 languages (README + FEATURES)

2026-03-29 05:32:01 -03:00

109 KiB

Raw Blame History

🚀 OmniRoute — Gateway-ul gratuit AI

Nu opriți niciodată codificarea. Dirijare inteligentă către modele AI GRATUITE și cu costuri reduse cu rezervă automată.

Proxy-ul dvs. universal API — un punct final, peste 67 de furnizori, zero timpi de nefuncționare. Acum, cu orchestrarea agentului MCP și A2A.

Finalizări de chat • Încorporare • Generare de imagini • Video • Muzică • Audio • Reclasificare • Căutare Web • Server MCP • Protocol A2A • 100% TypeScript

🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp

🆕 Ce este nou în v3.0.0

Faceți upgrade de la v2.9.5? — Consultați full CHANGELOG pentru toate modificările.

Zona	Schimbare
🔒 CodeQL Security	S-au remediat peste 10 alerte CodeQL: polinom-redouri, nesigure-aleatorie, remediere prin injecție shell
✅ Validare traseu	Toate cele 176 de rute API validate acum cu scheme Zod + treceri `validateBody()` — CI `check:route-validation:t06`
🐛 OmniModel Tag Leak	Etichetele interne `<omniModel>` nu mai curg către clienți în răspunsurile în flux SSE (#585)
🔑 Registered Keys API	Furnizarea automată a cheilor API prin `POST /api/v1/registered-keys` cu aplicarea cotei pentru fiecare furnizor/cont, idempotity, stocare SHA-256 și raportare opțională a problemelor GitHub
👁️ Scoped API Key Reveal 🆕	Opt-in recovery of API keys via `ALLOW_API_KEY_REVEAL`
🎨 Icoane furnizor	Peste 130 de sigle ale furnizorului prin `@lobehub/icons` (SVG) cu PNG → lanț de rezervă generic
🔄 Sincronizare automată a modelului	Programator 24 de ore și comutare manuală a interfeței de utilizare pentru a sincroniza listele de modele pentru furnizorii încorporați și personalizați compatibili cu OpenAI
🌐 OpenCode Zen/Go	Doi furnizori noi de la @kang-heewon prin PR #530: nivel gratuit + nivel de abonament prin `OpencodeExecutor`
🐛 Gemini CLI OAuth	Eroare acționabilă când `GEMINI_OAUTH_CLIENT_SECRET` lipsește în Docker (era o eroare Google criptică)
🐛 Configurare OpenCode	`saveOpenCodeConfig()` acum scrie corect TOML în `XDG_CONFIG_HOME`
🐛 Anulare model fixat	`body.model` setat corect la `pinnedModel` pentru protecția context-cache
🐛 Bucla Codex/Claude	`tool_result` blocuri convertite acum în text pentru a opri buclele infinite
🐛 Redirecționare autentificare	Conectarea nu se mai blochează după ce ați sărit peste configurarea parolei
🐛 Căi Windows	Căile MSYS2/Git-Bash (`/c/...`) normalizate la `C:\...` automat

🖼️ Tabloul de bord principal

📸 Previzualizarea tabloului de bord

Faceți clic pentru a vedea capturile de ecran de pe tabloul de bord

Pagina	Captură de ecran
Furnizori
Combo
Analitice
Sănătate
Translator
Setări
Instrumente CLI
Jurnale de utilizare
Punctele finale

🤖 Furnizor AI gratuit pentru agenții tăi preferați de codare

Conectați orice instrument IDE sau CLI alimentat de AI prin OmniRoute — gateway API gratuit pentru codare nelimitată.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Toți agenții se conectează prin http://localhost:20128/v1 sau http://cloud.omniroute.online.online/v1__OMNI6_TOKEN__EN modele și cotă nelimitate}



🤔 De ce OmniRoute?
Nu mai risipi banii și nu mai atingeți limitele:

 Cota de abonament expiră neutilizată în fiecare lună
 Limitele ratelor te opresc la mijloc de codare
 API-uri scumpe (20-50 USD/lună per furnizor)
 Comutare manuală între furnizori

OmniRoute rezolvă asta:

✅ Maximizați abonamentele - Urmăriți cota, utilizați fiecare bit înainte de resetare
✅ Auto de rezervă - Abonament → Cheie API → Ieftin → Gratuit, timp de nefuncționare zero
✅ Multi-cont - Round-robin între conturi pentru fiecare furnizor
✅ Universal - Funcționează cu Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, orice instrument CLI


📧 Suport

💬 Alăturați-vă comunității noastre! WhatsApp Group — Obțineți ajutor, împărtășiți sfaturi și fiți la curent.


Site web: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Probleme: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community Group
Contribuie: vezi CONTRIBUTING.md, deschide un PR sau alege un good first issue
Proiect original: 9router by decolua

🐛 Raportați o eroare?
Când deschideți o problemă, rulați comanda system-info și atașați fișierul generat:
npm run system-info
Aceasta generează un system-info.txt cu versiunea dvs. Node.js, versiunea OmniRoute, detaliile sistemului de operare, instrumentele CLI instalate (iflow, gemini, claude, codex, antigravity, droid etc.), starea Docker/PM2 și pachetele de sistem - tot ce avem nevoie pentru a reproduce problema rapid. Atașați fișierul direct la problema dvs. GitHub.

🔄 Cum funcționează
┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

🎯 Ce rezolvă OmniRoute — 30 de puncte reale de durere și cazuri de utilizare

Fiecare dezvoltator care folosește instrumente AI se confruntă zilnic cu aceste probleme. OmniRoute a fost creat pentru a le rezolva pe toate - de la depășiri de costuri la blocaje regionale, de la fluxuri OAuth întrerupte la operațiuni de protocol și observabilitate a întreprinderii.


💸 1. „Plătesc pentru un abonament scump, dar tot sunt întrerupt de limite”
Dezvoltatorii plătesc 20–200 USD/lună pentru Claude Pro, Codex Pro sau GitHub Copilot. Chiar și plătind, cota are un plafon - 5 ore de utilizare, limite săptămânale sau limite de tarif pe minut. La mijlocul sesiunii de codare, furnizorul nu mai răspunde și dezvoltatorul își pierde fluxul și productivitatea.
Cum o rezolvă OmniRoute:

Smart 4-Tier Fallback — Dacă cota de abonament se epuizează, redirecționează automat la cheia API → Ieftin → Gratuit fără intervenție manuală
Urmărirea cotelor în timp real — Afișează consumul de simboluri în timp real cu numărătoarea inversă de resetare (5 ore, zilnic, săptămânal)
Asistență pentru mai multe conturi — Conturi multiple per furnizor cu turneu automat automat — când unul se epuizează, trece la următorul
Combinații personalizate — Lanțuri de rezervă personalizabile cu 6 strategii de echilibrare (fill-first, round-robin, P2C, aleatoriu, cel mai puțin utilizat, optimizat din punct de vedere al costurilor)
Cote de afaceri Codex — Monitorizarea cotelor de spațiu de lucru pentru afaceri/echipe direct în tabloul de bord



🔌 2. „Trebuie să folosesc mai mulți furnizori, dar fiecare are un API diferit”
OpenAI folosește un format, Claude (Anthropic) folosește altul, Gemini încă altul. Dacă un dezvoltator dorește să testeze modele de la diferiți furnizori sau să se retragă între aceștia, trebuie să reconfigureze SDK-urile, să schimbe punctele finale, să se ocupe de formate incompatibile. Furnizorii personalizați (FriendLI, NIM) au puncte finale de model non-standard.
Cum o rezolvă OmniRoute:

Unified Endpoint — Un singur http://localhost:20128/v1 servește ca proxy pentru toți cei 67 de furnizori și peste
Traducerea formatului — Automată și transparentă: OpenAI ↔ Claude ↔ Gemeni ↔ Responses API
Response Sanitization — Elimina câmpurile nestandard (x_groq, usage_breakdown, service_tier) care încalcă OpenAI SDK v1.83+
Normalizarea rolurilor — Convertește developer → system pentru furnizorii non-OpenAI; system → user pentru GLM/ERNIE
Think Tag Extraction — Extrage blocurile <think> din modele precum DeepSeek R1 în reasoning_content standardizate
Ieșire structurată pentru Gemini — json_schema → responseMimeType/responseSchema conversie automată
stream este implicit false — Se aliniază cu specificațiile OpenAI, evitând SSE neașteptat în SDK-urile Python/Rust/Go



🌐 3. „Furnizorul meu de AI îmi blochează regiunea/țara”
Furnizori precum OpenAI/Codex blochează accesul din anumite regiuni geografice. Utilizatorii primesc erori precum unsupported_country_region_territory în timpul conexiunilor OAuth și API. Acest lucru este frustrant în special pentru dezvoltatorii din țările în curs de dezvoltare.
Cum o rezolvă OmniRoute:

3-Level Proxy Config — Proxy configurabil la 3 niveluri: global (tot traficul), per furnizor (doar un singur furnizor) și per conexiune/cheie
Insigne de proxy cu coduri de culoare — Indicatori vizuali: 🟢 proxy global, 🟡 proxy furnizor, 🔵 proxy de conexiune, indicând întotdeauna IP-ul
Schimb de jetoane OAuth prin proxy — fluxul OAuth trece și prin proxy, rezolvând unsupported_country_region_territory
Teste de conexiune prin proxy — Testele de conexiune folosesc proxy-ul configurat (nu mai este ocolire directă)
Support SOCKS5 — Suport complet SOCKS5 proxy pentru rutarea de ieșire
TLS Fingerprint Spoofing — Amprenta TLS asemănătoare unui browser prin wreq-js pentru a ocoli detectarea botului
🔏 CLI Fingerprint Matching — Reordonează anteturile și câmpurile de corp pentru a se potrivi cu semnăturile binare CLI native, reducând drastic riscul de semnalare a contului. IP-ul proxy este păstrat - obțineți simultan mascarea IP stealth ** și**



🆓 4. „Vreau să folosesc AI pentru codare, dar nu am bani”
Nu toată lumea poate plăti 20–200 USD/lună pentru abonamentele AI. Studenții, dezvoltatorii din țările emergente, pasionații și freelancerii au nevoie de acces la modele de calitate la cost zero.
Cum o rezolvă OmniRoute:

Free Tier Providers Built-in — Suport nativ pentru furnizori 100% gratuiti: iFlow (5 modele nelimitate prin OAuth: kimi-k2-thinking, qwen3-coder-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 modele nelimitate: q-coder-3-fwen: qwen3-coder-next, vision-model), Kiro (Claude + AWS Builder ID gratuit), Gemini CLI (180.000 de jetoane/lună gratuit)
Ollama Cloud — Modele Ollama găzduite în cloud la api.ollama.com cu nivelul gratuit „Utilizare ușoară”; utilizați prefixul ollamacloud/<model>
Combo-uri numai gratuite — Lanț gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = 0 USD/lună fără timp de nefuncționare
NVIDIA NIM Free Access — ~40 RPM dev-forever acces gratuit la peste 70 de modele la build.nvidia.com (tranziție de la credite la limitele de rate pur)
Cost Optimized Strategy — Strategie de rutare care alege automat cel mai ieftin furnizor disponibil



🔒 5. „Trebuie să-mi protejez poarta AI de accesul neautorizat”
Când expuneți un gateway AI în rețea (LAN, VPS, Docker), oricine are adresa poate consuma jetoanele/cota dezvoltatorului. Fără protecție, API-urile sunt vulnerabile la utilizare greșită, injectare promptă și abuz.
Cum o rezolvă OmniRoute:

Gestionarea cheilor API — Generare, rotație și stabilire a domeniului pentru fiecare furnizor cu o pagină dedicată /dashboard/api-manager
Permisiuni la nivel de model — Restricționați cheile API la anumite modele (openai/*, modele cu caractere metalice), cu comutarea Permite tot/Restricționați
API Endpoint Protection — Solicitați o cheie pentru /v1/models și blocați anumiți furnizori din listă
Auth Guard + CSRF Protection — Toate rutele tabloului de bord sunt protejate cu middleware withAuth + jetoane CSRF
Rate Limiter — Limitarea ratei per-IP cu ferestre configurabile
Filtrare IP — Lista permisă/lista blocată pentru controlul accesului
Prompt Injection Guard — Igienizare împotriva tiparelor de prompte rău intenționate
Criptare AES-256-GCM — Acreditări criptate în repaus



🛑 6. „Furnizorul meu a căzut și mi-am pierdut fluxul de codare”
Furnizorii de AI pot deveni instabili, pot returna erori 5xx sau pot atinge limitele temporare ale ratei. Dacă un dezvoltator depinde de un singur furnizor, acesta este întrerupt. Fără întreruptoare, reîncercări repetate pot bloca aplicația.
Cum o rezolvă OmniRoute:

Circuit Breaker per-model - Deschidere/închidere automată cu praguri configurabile și răcire (Închis/Deschis/Pe jumătate deschis), pentru fiecare model pentru a evita blocurile în cascadă
Backoff exponențial — Întârzieri progresive ale reîncercării
Anti-Thundering Herd — Mutex + protecție semafor împotriva furtunilor concurente de reîncercare
Combo Fallback Chains — Dacă furnizorul principal eșuează, trece automat prin lanț fără nicio intervenție
Combo Circuit Breaker — Dezactivează automat furnizorii care eșuează dintr-un lanț combinat
Tabloul de bord pentru sănătate — Monitorizare timp de funcționare, stări întrerupătoare de circuit, blocări, statistici cache, latență p50/p95/p99



🔧 7. „Configurarea fiecărui instrument AI este plictisitoare și repetitivă”
Dezvoltatorii folosesc Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Fiecare instrument are nevoie de o configurație diferită (punct final API, cheie, model). Reconfigurarea la schimbarea de furnizor sau de model este o pierdere de timp.
Cum o rezolvă OmniRoute:

CLI Tools Dashboard — pagină dedicată cu setare cu un singur clic pentru Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
GitHub Copilot Config Generator — generează chatLanguageModels.json pentru VS Code cu selecția în bloc a modelului
Onboarding Wizard — Configurare ghidată în 4 pași pentru utilizatorii debutanți
Un punct final, toate modelele — Configurați http://localhost:20128/v1 o dată, accesați peste 67 de furnizori



🔑 8. „Gestionarea jetoanelor OAuth de la mai mulți furnizori este un iad”
Claude Code, Codex, Gemini CLI, Copilot - toate folosesc OAuth 2.0 cu token-uri care expiră. Dezvoltatorii trebuie să se reautentifice în mod constant, să se ocupe de client_secret is missing, redirect_uri_mismatch și defecțiunile de pe serverele de la distanță. OAuth pe LAN/VPS este deosebit de problematică.
Cum o rezolvă OmniRoute:

Reîmprospătare automată a simbolurilor — jetoanele OAuth se reîmprospătează în fundal înainte de expirare
OAuth 2.0 (PKCE) încorporat — Flux automat pentru Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
OAuth cu mai multe conturi — Conturi multiple per furnizor prin extragerea jetonului JWT/ID
OAuth LAN/Remediere la distanță — Detectare IP privată pentru redirect_uri + modul URL manual pentru servere la distanță
OAuth în spatele Nginx — Utilizează window.location.origin pentru compatibilitatea cu proxy invers
Ghid OAuth la distanță — Ghid pas cu pas pentru acreditările Google Cloud pe VPS/Docker



📊 9. „Nu știu cât cheltuiesc sau unde”
Dezvoltatorii folosesc mai mulți furnizori plătiți, dar nu au o viziune unificată asupra cheltuielilor. Fiecare furnizor are propriul tablou de bord de facturare, dar nu există o vizualizare consolidată. Costurile neașteptate se pot acumula.
Cum o rezolvă OmniRoute:

Tabloul de bord pentru analiza costurilor — Urmărirea costurilor pe token și gestionarea bugetului per furnizor
Limite bugetare pe nivel — Plafonul de cheltuieli pe nivel care declanșează o rezervă automată
Configurație de preț pe model — Prețuri configurabile pe model
Statistici de utilizare per cheie API — Numărul de solicitări și marcajul temporal al ultimei utilizări per cheie
Tabloul de bord de analiză — Carduri cu statistici, diagramă de utilizare a modelului, tabel cu furnizori cu rate de succes și latență



🐛 10. „Nu pot diagnostica erorile și problemele în apelurile AI”
Când un apel eșuează, dezvoltatorul nu știe dacă a fost o limită de rată, un simbol expirat, un format greșit sau o eroare a furnizorului. Jurnalele fragmentate pe diferite terminale. Fără observabilitate, depanarea este o încercare și eroare.
Cum o rezolvă OmniRoute:

Tabloul de bord pentru jurnalele unificate — 4 file: jurnalele de solicitare, jurnalele proxy, jurnalele de audit, consolă
Console Log Viewer — Vizualizator în timp real în stil terminal cu niveluri codificate în culori, defilare automată, căutare, filtru
SQLite Proxy Logs — Jurnale persistente care supraviețuiesc repornirilor serverului
Translator Playground — 4 moduri de depanare: Playground (traducere format), Chat Tester (dus-întors), Test Bench (lot), Live Monitor (în timp real)
Solicitare telemetrie — latență p50/p95/p99 + urmărire X-Request-Id
Înregistrare bazată pe fișiere cu rotație — Interceptor de consolă captează totul în jurnalul JSON cu rotație bazată pe dimensiune
System Info Report — npm run system-info generează system-info.txt cu mediul dumneavoastră complet (versiunea Node, versiunea OmniRoute, OS, instrumente CLI, starea Docker/PM2). Atașați-l când raportați probleme pentru triaj instantaneu.



🏗️ 11. „Implementarea și întreținerea gateway-ului este complexă”
Instalarea, configurarea și menținerea unui proxy AI în diferite medii (local, VPS, Docker, cloud) necesită multă muncă. Probleme precum căile codificate, EACCES pe directoare, conflictele de porturi și versiunile multiplatforme adaugă fricțiuni.
Cum o rezolvă OmniRoute:

npm global install — npm install -g omniroute && omniroute — gata
Docker Multi-Platform - AMD64 + ARM64 nativ (Apple Silicon, AWS Graviton, Raspberry Pi)
Docker Compose Profiles — base (fără instrumente CLI) și cli (cu Claude Code, Codex, OpenClaw)
Electron Desktop App — aplicație nativă pentru Windows/macOS/Linux cu bară de sistem, pornire automată, mod offline
Split-Port Mode — API și tablou de bord pe porturi separate pentru scenarii avansate (reverse proxy, rețea container)
Cloud Sync — Configurați sincronizarea între dispozitive prin Cloudflare Workers
Backups DB — Backup automat, restaurare, export și import al tuturor setărilor



🌍 12. „Interfața este doar în limba engleză și echipa mea nu vorbește engleză”
Echipele din țările care nu vorbesc engleza, în special din America Latină, Asia și Europa, se luptă cu interfețele doar în limba engleză. Barierele lingvistice reduc adoptarea și cresc erorile de configurare.
Cum o rezolvă OmniRoute:

Tabloul de bord i18n — 30 de limbi — Toate cele peste 500 de taste traduse, inclusiv arabă, bulgară, daneză, germană, spaniolă, finlandeză, franceză, ebraică, hindi, maghiară, indoneziană, italiană, japoneză, coreeană, malay, olandeză, norvegiană, poloneză, portugheză (PT/BR), română, rusă, slovacă, suedeză, thailandeză, ucraineană, filipineză, engleză, chineză, vietnameză,
** Suport RTL** — Suport de la dreapta la stânga pentru arabă și ebraică
ReadME-uri în mai multe limbi — 30 de traduceri complete de documentație
Selector de limbă — Pictograma glob în antet pentru comutare în timp real



🔄 13. „Am nevoie de mai mult decât de chat — am nevoie de încorporare, imagini, audio”
AI nu este doar finalizarea chatului. Dezvoltatorii trebuie să genereze imagini, să transcrie sunetul, să creeze înglobări pentru RAG, să reclasifice documentele și să modereze conținutul. Fiecare API are un punct final și un format diferit.
Cum o rezolvă OmniRoute:

Embeddings — /v1/embeddings cu 6 furnizori și peste 9 modele
Image Generation — /v1/images/generations cu 10 furnizori și peste 20 de modele (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
Text-to-Video — /v1/videos/generations — ComfyUI (AnimateDiff, SVD) și SD WebUI
Text-to-Music — /v1/music/generations — ComfyUI (Stable Audio Open, MusicGen)
Transcriere audio — /v1/audio/transcriptions — Whisper + Nvidia NIM, HuggingFace, Qwen3
Text-to-Speech — /v1/audio/speech — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT, + furnizori existenți
Moderări — /v1/moderations — Verificări privind siguranța conținutului
Reclasificare — /v1/rerank — Reclasificarea relevanței documentului
Responses API — Suport complet /v1/responses pentru Codex



🧪 14. „Nu am cum să testez și să compar calitatea între modele”
Dezvoltatorii vor să știe care model este cel mai bun pentru cazul lor de utilizare - cod, traducere, raționament - dar compararea manuală este lentă. Nu există instrumente de evaluare integrate.
Cum o rezolvă OmniRoute:

Evaluări LLM — Testarea setului de aur cu 10 cazuri preîncărcate care acoperă salutări, matematică, geografie, generare de cod, conformitate cu JSON, traducere, reducere, refuz de siguranță
4 strategii de potrivire — exact, contains, regex, custom (funcția JS)
Translator Playground Test Bench — Testare în loturi cu mai multe intrări și rezultate așteptate, comparație între furnizori
Tester de chat — Tur complet dus-întors cu randare vizuală a răspunsului
Live Monitor — Flux în timp real al tuturor solicitărilor care circulă prin proxy



📈 15. „Trebuie să mă extind fără a pierde performanța”
Pe măsură ce volumul cererilor crește, fără memorarea în cache aceleași întrebări generează costuri duplicate. Fara idempotenta, cererile duplicate procesarea deseurilor. Limitele de tarife pentru fiecare furnizor trebuie respectate.
Cum o rezolvă OmniRoute:

Cache semantic — Cache-ul pe două niveluri (semnătură + semantică) reduce costurile și latența
Request Idempotency — fereastră de deduplicare 5s pentru cereri identice
Rate Limit Detection — RPM per furnizor, interval minim și urmărire simultană maximă
Limite de rată editabile — Valori implicite configurabile în Setări → Reziliență cu persistență
API Key Validation Cache — cache pe 3 niveluri pentru performanța producției
Tabloul de bord pentru sănătate cu telemetrie — latență p50/p95/p99, statistici cache, timp de funcționare



🤖 16. „Vreau să controlez comportamentul modelului la nivel global”
Dezvoltatori care doresc toate răspunsurile într-o anumită limbă, cu un anumit ton sau care doresc să limiteze simbolurile de raționament. Configurarea acestui lucru în fiecare instrument/cerere nu este practică.
Cum o rezolvă OmniRoute:

System Prompt Injection — Prompt global aplicat tuturor solicitărilor
Thinking Budget Validation — Controlul raționării alocării token-ului per cerere (transmis, automat, personalizat, adaptiv)
6 Strategii de rutare — Strategii globale care determină modul în care sunt distribuite cererile
Wildcard Router — modelele provider/* sunt direcționate dinamic către orice furnizor
Combo Activare/Dezactivare Comutare — Comută combo direct din tabloul de bord
Comutare furnizor — Activați/dezactivați toate conexiunile pentru un furnizor cu un singur clic
Furnizori blocați — Excludeți anumiți furnizori din lista /v1/models



🧰 17. „Am nevoie de instrumente MCP ca capabilități de produs de primă clasă”
Multe gateway-uri AI expun MCP doar ca un detaliu ascuns de implementare. Echipele au nevoie de un nivel de operare vizibil și ușor de gestionat.
Cum o rezolvă OmniRoute:

MCP apare în panoul de bord de navigare și fila de protocol final
Pagina de management MCP dedicată cu proces, instrumente, domenii și audit
Pornire rapidă încorporată pentru omniroute --mcp și integrarea clientului



🧠 18. „Am nevoie de orchestrare A2A cu sincronizare + căi de activități de flux”
Fluxurile de lucru ale agenților necesită atât răspunsuri directe, cât și execuție în flux de lungă durată, cu control ciclului de viață.
Cum o rezolvă OmniRoute:

Punct final JSON-RPC A2A (POST /a2a) cu message/send și message/stream
Streaming SSE cu propagare a stării terminale
API-uri pentru ciclul de viață al sarcinilor pentru tasks/get și tasks/cancel



🛰️ 19. „Am nevoie de sănătate reală a procesului MCP, nu de stare ghicită”
Echipele operaționale trebuie să știe dacă MCP este de fapt în viață, nu doar dacă un API este accesibil.
Cum o rezolvă OmniRoute:

Fișier runtime heartbeat cu PID, marcaje de timp, transport, număr de instrumente și modul de aplicare
API de stare MCP care combină bătăile inimii + activitatea recentă
Carduri de stare a interfeței de utilizare pentru prospețimea procesului/uptime/inima



📋 20. „Am nevoie de execuție auditabilă a instrumentului MCP”
Când instrumentele modifică configurația sau declanșează acțiuni operaționale, echipele au nevoie de trasabilitate criminalistică.
Cum o rezolvă OmniRoute:

Înregistrare de audit susținută de SQLite pentru apelurile instrumentelor MCP
Filtrează după instrument, succes/eșec, cheie API și paginare
Tabelul de audit al tabloului de bord + punctele finale de statistici pentru automatizare



🔐 21. „Am nevoie de permisiuni MCP pentru fiecare integrare”
Clienții diferiți ar trebui să aibă cel mai mic privilegiu de acces la categoriile de instrumente.
Cum o rezolvă OmniRoute:

9 lunete MCP granulare pentru acces controlat la instrumente
Aplicarea domeniului de aplicare și vizibilitatea în interfața de utilizare a managementului MCP
Poziție implicită sigură pentru instrumentele operaționale



⚙️ 22. „Am nevoie de controale operaționale fără redistribuire”
Echipele au nevoie de modificări rapide ale timpului de rulare în timpul incidentelor sau evenimentelor de cost.
Cum o rezolvă OmniRoute:

Comutați activarea comboi direct din tabloul de bord MCP
Aplicați profiluri de rezistență din pachetele de politici predefinite
Resetați starea întreruptorului de la același panou de operare



🔄 23. „Am nevoie de vizibilitate și anulare live a ciclului de viață al sarcinii A2A”
Fără vizibilitatea ciclului de viață, incidentele sarcinilor devin greu de triat.
Cum o rezolvă OmniRoute:

Listarea sarcinilor/filtrarea după stare/abilitate cu paginare
Detaliați metadatele sarcinii, evenimentele și artefactele
Punct final de anulare a sarcinii și acțiune UI cu confirmare



🌊 24. „Am nevoie de valori active de flux pentru încărcarea A2A”
Fluxurile de lucru în flux necesită o perspectivă operațională privind concurența și conexiunile live.
Cum o rezolvă OmniRoute:

Contoare active de flux integrate în starea A2A
Marcaj de timp pentru ultima sarcină și numărătoare pentru fiecare stat
Carduri de bord A2A pentru monitorizarea operațiunilor în timp real



🪪 25. „Am nevoie de descoperire de agent standard pentru clienți”
Clienții externi și orchestratorii au nevoie de metadate care pot fi citite de mașină pentru integrare.
Cum o rezolvă OmniRoute:

Card de agent expus la /.well-known/agent.json
Capabilități și abilități afișate în UI de management
API-ul de stare A2A include metadate de descoperire pentru automatizare



🧭 26. „Am nevoie de descoperirea protocolului în UX-ul produsului”
Dacă utilizatorii nu pot descoperi suprafețele de protocol, calitatea adoptării și a suportului scade.
Cum o rezolvă OmniRoute:

Pagina consolidată Puncte finale cu file pentru punctele finale Proxy, MCP, A2A și API
Comută starea serviciului în linie (Online/Offline) pentru MCP și A2A
Link-uri de la prezentare generală la file dedicate de gestionare



🧪 27. „Am nevoie de validarea protocolului end-to-end cu clienți reali”
Testele simulate nu sunt suficiente pentru a valida compatibilitatea protocolului înainte de lansare.
Cum o rezolvă OmniRoute:

Suita E2E care pornește aplicația și utilizează transportul clientului MCP SDK real
Testele client A2A pentru descoperirea, trimiterea, transmiterea în flux, obținerea și anularea fluxurilor
Verificați încrucișați afirmațiile cu auditul MCP și API-urile pentru sarcini A2A



📡 28. „Am nevoie de observabilitate unificată pe toate interfețele”
Împărțirea observabilității în funcție de protocol creează puncte oarbe și MTTR mai lung.
Cum o rezolvă OmniRoute:

Tablouri de bord/jurnale/analitice unificate într-un singur produs
Sănătate + audit + solicitare de telemetrie în straturi OpenAI, MCP și A2A
API-uri operaționale pentru stare și automatizare



💼 29. „Am nevoie de un timp de rulare pentru proxy + instrumente + orchestrare agent”
Rularea multor servicii separate crește costurile operaționale și modurile de eșec.
Cum o rezolvă OmniRoute:

Proxy compatibil OpenAI, server MCP și server A2A într-o singură stivă
Autentificare partajată, rezistență, stocare de date și observabilitate
Model de politică consistent pe toate suprafețele de interacțiune



🚀 30. „Trebuie să trimit fluxuri de lucru agentice fără extinderea codului lipici”
Echipele își pierd din viteza atunci când realizează mai multe servicii și scripturi ad-hoc.
Cum o rezolvă OmniRoute:

Strategie unificată pentru clienți și agenți
Interfețe de utilizare a protocolului încorporate și căi de validare a fumului
Baze pregătite pentru producție (securitate, logare, rezistență, backup)


Exemple de manuale (cazuri de utilizare integrate)
Playbook A: Maximizați abonamentul plătit + backup ieftin
Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption
Playbook B: teanc de codare cu costuri zero
Combo: "free-forever"
  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0
Outcome: stable free coding workflow
Playbook C: lanț alternativ permanent activ 24/7
Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads
Playbook D: Agentul operează cu MCP + A2A
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/endpoint (MCP and A2A tabs)
4) Toggle services via inline status controls

🆓 Începe gratuit — Cost de configurare zero

Configurați codarea AI în minute la $0/lună. Conectați aceste conturi gratuite și utilizați combinația încorporată Free Stack.




Pasul
Acțiune
Furnizori deblocați




1
Conectați Kiro (AWS Builder ID OAuth)
Claude Sonnet 4.5, Haiku 4.5 — nelimitat


2
Conectați iFlow (Google OAuth)
kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... — nelimitat


3
Conectați Qwen (Codul dispozitivului)
qwen3-coder-plus, qwen3-coder-flash... — nelimitat


4
Conectați Gemini CLI (Google OAuth)
gemini-3-flash, gemini-2.5-pro — 180K/lună gratuit


5
/dashboard/combos → șablon Stiva gratuită ($0)
Round-robin toți furnizorii gratuiti în mod automat



** Indicați orice IDE/CLI către:** http://localhost:20128/v1 · Cheie API: any-string · Terminat.

Acoperire suplimentară opțională (de asemenea gratuită): Cheie Groq API (30 RPM gratuit), NVIDIA NIM (40 RPM fără, peste 70 de modele), Cerebras (1M tok/zi), LongCat API key (50M tokens/zi!), Cloudflare Workers AI (10K Neurons/zi, 50+ modele).

⚡ Pornire rapidă
1) Instalați și rulați
npm install -g omniroute
omniroute

Utilizatori pnpm: Rulați pnpm approve-builds -g după instalare pentru a activa scripturile de compilare native cerute de better-sqlite3 și @swc/core:
pnpm install -g omniroute
pnpm approve-builds -g   # Select all packages → approve
omniroute

Tabloul de bord se deschide la http://localhost:20128 și adresa URL de bază a API este http://localhost:20128/v1.



Comanda
Descriere




omniroute
Porniți serverul (PORT=20128, API și tabloul de bord pe același port)


omniroute --port 3000
Setați portul canonic/API la 3000


omniroute --mcp
Porniți serverul MCP (transport stdio)


omniroute --no-open
Nu deschideți automat browserul


omniroute --help
Arată ajutor



Opțional modul split-port:
PORT=20128 DASHBOARD_PORT=20129 omniroute
# API:       http://localhost:20128/v1
# Dashboard: http://localhost:20129
2) Conectați furnizorii și creați-vă cheia API

Deschideți Dashboard → Providers și conectați cel puțin un furnizor (OAuth sau cheie API).
Deschideți Dashboard → Endpoints și creați o cheie API.
(Opțional) Deschideți Dashboard → Combos și setați lanțul de rezervă.

3) Îndreptați instrumentul de codare către OmniRoute
Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)
Funcționează cu Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode și SDK-uri compatibile cu OpenAI.
4) Activați și validați protocoalele (v2.0)
MCP (pentru operațiuni cu scule):
omniroute --mcp
Apoi conectați-vă clientul MCP prin stdio și testați instrumente precum:

omniroute_get_health
omniroute_list_combos

A2A (pentru fluxuri de lucru de la agent la agent):
curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
5) Validați totul de la capăt la capăt (recomandat)
npm run test:protocols:e2e
Această suită validează fluxurile reale de clienți MCP și A2A împotriva unei aplicații care rulează.
Alternativă: rulează de la sursă
cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev

🐳 Docker
OmniRoute este disponibil ca imagine publică Docker pe Docker Hub.
Alergare rapidă:
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Cu fișier de mediu:
# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Utilizarea Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d



Imagine
Etichetă
Dimensiune
Descriere




diegosouzapw/omniroute
latest
~250MB
Ultima versiune stabilă


diegosouzapw/omniroute
1.0.3
~250MB
Versiunea curentă




🖥️ Aplicație desktop — Offline și mereu activată

🆕 NOU! OmniRoute este acum disponibil ca aplicație desktop nativă pentru Windows, macOS și Linux.

Rulați OmniRoute ca o aplicație desktop autonomă - fără terminal, fără browser, fără internet necesar pentru modelele locale. Aplicația bazată pe electroni include:

🖥️ Fereastra nativă — Fereastra aplicației dedicată cu integrare în tava de sistem
🔄 Auto-Start — Lansați OmniRoute la autentificarea sistemului
🔔 Notificări native — Primiți alerte pentru epuizarea cotelor sau probleme legate de furnizor
⚡ Instalare cu un singur clic — NSIS (Windows), DMG (macOS), AppImage (Linux)
🌐 Mod offline — Funcționează complet offline cu serverul inclus

Pornire rapidă
# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)
Tava de sistem
Când este minimizat, OmniRoute se află în bara de sistem cu acțiuni rapide:

Deschide tabloul de bord
Schimbați portul serverului
Închideți aplicația

📖 Documentație completă: OMNI_TOKEN_153

💰 Prețurile dintr-o privire



Nivelul
Furnizor
Cost
Resetare cotă
Cel mai bun pentru




💳 ABONAMENT
Claude Code (Pro)
20 USD/lună
5h + săptămânal
Deja abonat



Codex (Plus/Pro)
20-200 USD/lună
5h + săptămânal
Utilizatori OpenAI



Gemeni CLI
GRATIS
180K/lună + 1K/zi
Toată lumea!



GitHub Copilot
10-19 USD/lună
Lunar
utilizatorii GitHub


🔑 CHEIA API
NVIDIA NIM
GRATIS (dev forever)
~40 RPM
70+ modele deschise



Cerebre
GRATIS (1M tok/zi)
60K TPM / 30 RPM
Cel mai rapid din lume



Groq
GRATIS (30 RPM)
14,4K RPD
Llama/Gemma ultra-rapidă



DeepSeek V3.2
0,27 USD/1,10 USD per 1 milion
Niciuna
Cel mai bun raționament preț/calitate



xAI Grok-4 Fast
0,20 USD/0,50 USD pe 1M 🆕
Niciuna
Cea mai rapidă + apelare instrument, ultralow



xAI Grok-4 (standard)
0,20 USD/1,50 USD per 1 milion 🆕
Niciuna
Raționamentul emblematic de la xAI



Mistral
Probă gratuită + plătit
Tarif limitat
IA europeană



OpenRouter
Plată-pe-utilizare
Niciuna
100+ modele agr.


💰 IEFTIN
GLM-5 (prin Z.AI) 🆕
0,5 USD/1 milion
Zilnic 10:00
Ieșire 128K, cel mai nou flagship



GLM-4.7
0,6 USD/1 milion
Zilnic 10:00
Backup buget



MiniMax M2.5 🆕
Intrare de 0,3 USD/1 milion
rulare de 5 ore
Raționament + sarcini agentice



MiniMax M2.1
0,2 USD/1 milion
rulare de 5 ore
Cea mai ieftină opțiune



Kimi K2.5 (API Moonshot) 🆕
Plată-pe-utilizare
Niciuna
Acces direct API Moonshot



Kimi K2
9 USD/lună plat
10 milioane de jetoane/lună
Cost previzibil


🆓 GRATUIT
iFlow
$0
Nelimitat
5 modele nelimitat



Qwen
$0
Nelimitat
4 modele nelimitat



Kiro
$0
Nelimitat
Claude Sonnet/Haiku (AWS Builder)



LongCat Flash-Lite 🆕
$0 (50 M tok/zi 🔥)
1 RPS
Cea mai mare cotă gratuită de pe Pământ



Polenizări AI 🆕
$0 (nu este nevoie de cheie)
1 solicitat/15s
GPT-5, Claude, DeepSeek, Llama 4



Cloudflare Workers AI 🆕
$0 (10K Neuroni/zi)
~150 resp/zi
50+ modele, avantaj global



Scaleway AI 🆕
$0 (1 milion de jetoane în total)
Tarif limitat
UE/GDPR, Qwen3 235B, Llama 70B




🆕 Modele noi adăugate (mar 2026): Familia Grok-4 Fast la 0,20 USD/0,50 USD/M (evaluat la 1143 ms — cu 30% mai rapid decât Gemini 2.5 Flash), GLM-5 prin Z.AI cu ieșire de 128K, Raționament MiniMax M2.5, Raționamentul KimiSeek 5, actualizare Deep2.5. API direct Moonshot.

💡 Stivă combinată de 0 USD — Configurare completă gratuită:
# 🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever
Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free API key
Cloudflare AI (cf/)    → Llama 70B, Gemma 3, Mistral — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma ultra-fast — 14.4K req/day
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day
** Cost zero. Nu se oprește niciodată codificarea.** Configurați acest lucru ca un combo OmniRoute și toate alternativele au loc automat - fără comutare manuală vreodată.


🆓 Modele gratuite — Ce obțineți de fapt

Toate modelele de mai jos sunt 100% gratuite, fără card de credit necesar. OmniRoute face trasee automate între ele când se epuizează o cotă - combină-le pe toate pentru o combinație de 0 USD de neîntrerupt.

🔵 MODELE CLAUDE (prin Kiro — AWS Builder ID)



Model
Prefix
Limită
Limită de rată




claude-sonnet-4.5
kr/
Nelimitat
Niciun plafon zilnic raportat


claude-haiku-4.5
kr/
Nelimitat
Niciun plafon zilnic raportat


claude-opus-4.6
kr/
Nelimitat
Ultimul Opus prin Kiro



🟢 MODELE IFLOW (OAuth gratuit — fără card de credit)



Model
Prefix
Limită
Limită de rată




kimi-k2-thinking
if/
Nelimitat
Nicio limită raportată


qwen3-coder-plus
if/
Nelimitat
Nicio limită raportată


deepseek-r1
if/
Nelimitat
Nicio limită raportată


minimax-m2.1
if/
Nelimitat
Nicio limită raportată


kimi-k2
if/
Nelimitat
Nicio limită raportată



🟡 MODELE QWEN (Autentificare cod dispozitiv)



Model
Prefix
Limită
Limită de rată




qwen3-coder-plus
qw/
Nelimitat
Nicio limită raportată


qwen3-coder-flash
qw/
Nelimitat
Nicio limită raportată


qwen3-coder-next
qw/
Nelimitat
Nicio limită raportată


vision-model
qw/
Nelimitat
Multimodal (imagini)



🟣 GEMINI CLI (Google OAuth)



Model
Prefix
Limită
Limită de rată




gemini-3-flash-preview
gc/
180K tok/lună + 1K/zi
Resetare lunară


gemini-2.5-pro
gc/
180K/lună (piscina comună)
Calitate înaltă



⚫ NVIDIA NIM (Cheie API gratuită — build.nvidia.com)



Nivelul
Limită zilnică
Limită de rată
Note




Gratuit (Dev)
Fără capac de simbol
~40 RPM
70+ modele; trecerea la limitele ratei pure la mijlocul anului 2025



Modele gratuite populare: moonshotai/kimi-k2.5 (Kimi K2.5), z-ai/glm4.7 (GLM 4.7), deepseek-ai/deepseek-v3.2 (DeepSeek V3.2), nvidia/llama-3.3-70b-instruct, OMNI18EN
⚪ CEREBRAS (Cheie API gratuită — inference.cerebras.ai)



Nivelul
Limită zilnică
Limită de rată
Note




Gratuit
1 milion de jetoane/zi
60K TPM / 30 RPM
Cea mai rapidă inferență LLM din lume; resetează zilnic



Disponibil gratuit: llama-3.3-70b, llama-3.1-8b, deepseek-r1-distill-llama-70b
🔴 GROQ (Cheie API gratuită — console.groq.com)



Nivelul
Limită zilnică
Limită de rată
Note




Gratuit
14,4K RPD
30 RPM per model
Fără card de credit; 429 în limită, netaxat



Disponibil gratuit: llama-3.3-70b-versatile, gemma2-9b-it, mixtral-8x7b, whisper-large-v3
🔴 LONGCAT AI (Cheie API gratuită — longcat.chat) 🆕



Model
Prefix
Cotă zilnică gratuită
Note




LongCat-Flash-Lite
lc/
50M de jetoane 💥
Cea mai mare cotă gratuită vreodată


LongCat-Flash-Chat
lc/
500K jetoane
Chat în mai multe rânduri


LongCat-Flash-Thinking
lc/
500K jetoane
Raționament / CoT


LongCat-Flash-Thinking-2601
lc/
500K jetoane
Versiunea ianuarie 2026


LongCat-Flash-Omni-2603
lc/
500K jetoane
Multimodal




100% gratuit în timpul beta public. Înscrieți-vă la longcat.chat cu e-mail sau telefon. Se resetează zilnic la 00:00 UTC.

🟢 POLLINATIONS AI (Nu este necesară nicio cheie API) 🆕



Model
Prefix
Limită de rată
Furnizor în spatele




openai
pol/
1 solicitat/15s
GPT-5


claude
pol/
1 solicitat/15s
Claude antropic


gemini
pol/
1 solicitat/15s
Google Gemeni


deepseek
pol/
1 solicitat/15s
DeepSeek V3


llama
pol/
1 solicitat/15s
Meta Llama 4 Scout


mistral
pol/
1 solicitat/15s
Mistral AI




✨ Zero frecare: Fără înscriere, fără cheie API. Adăugați furnizorul de polenizări cu un câmp cheie gol și funcționează imediat.

🟠 CLOUDFLARE WORKERS AI (Cheie API gratuită — cloudflare.com) 🆕



Nivelul
Neuroni zilnici
Utilizare echivalentă
Note




Gratuit
10.000
~150 LLM resp / 500s audio / 15K încorporare
Avantaj global, peste 50 de modele



Modele gratuite populare: @cf/meta/llama-3.3-70b-instruct, @cf/google/gemma-3-12b-it, @cf/openai/whisper-large-v3-turbo (audio gratuit!), @cf/qwen/qwen2.5-coder-15b-instruct

Necesită API Token + ID cont de la dash.cloudflare.com. Stocați ID-ul contului în setările furnizorului.

🟣 SCALEWAY AI (1 milion de jetoane gratuite — scaleway.com) 🆕



Nivelul
Cotă gratuită
Localizare
Note




Gratuit
1 milion de jetoane
🇫🇷 Paris, UE
Nu este nevoie de card de credit în limite



Disponibil gratuit: qwen3-235b-a22b-instruct-2507 (Qwen3 235B!), llama-3.1-70b-instruct, mistral-small-3.2-24b-instruct-2506, deepseek-v3-0324

Conform UE/GDPR. Obțineți cheia API la console.scaleway.com.


💡 Ultima stivă gratuită (11 furnizori, 0 USD pentru totdeauna):
Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder models UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free
Cloudflare AI (cf/)    → 50+ models — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma — 14.4K req/day ultra-fast
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day

🎙️ Combo de transcriere gratuită

Transcrie orice audio/video pentru $0 — Deepgram conduce cu 200 USD gratuit, AssemblyAI 50 USD alternativ, Groq Whisper ca rezervă nelimitată de urgență.




Furnizor
Credite gratuite
Cel mai bun model
Limită de rată




🟢 Deepgram
200 USD gratuit (înscriere)
nova-3 — cea mai bună acuratețe, peste 30 de limbi
Fără limită RPM pentru creditele gratuite


🔵 AsamblareAI
50 USD gratuit (înscriere)
universal-3-pro — capitole, sentiment, PII
Fără limită RPM pentru creditele gratuite


🔴 Groq
Gratuit pentru totdeauna
whisper-large-v3 — OpenAI Whisper
30 RPM (rată limitată)



Combinație sugerată în /dashboard/combos:
Name: free-transcription
Strategy: Priority
Nodes:
  [1] deepgram/nova-3          → uses $200 free first
  [2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
  [3] groq/whisper-large-v3    → free forever, emergency fallback
Apoi, în /dashboard/media → fila Transcriere: încărcați orice fișier audio sau video → selectați punctul final combo → obțineți transcrierea în formatele acceptate.
💡 Caracteristici cheie
OmniRoute v2.0 este construit ca o platformă operațională, nu doar un proxy-releu.
🆕 Nou — Îmbunătățiri inspirate de ClawRouter (martie 2026)



Caracteristica
Ce face




⚡ Grok-4 Fast Family
Modele xAI la 0,20 USD/0,50 USD/M — etalon de 1143 ms (30% mai rapid decât Gemini 2.5 Flash)


🧠 GLM-5 prin Z.AI
Context de ieșire de 128.000, 0,5 USD/1 milion — cel mai nou flagship din familia GLM


🔮 MiniMax M2.5
Raționament + sarcini agentice la 0,30 USD/1 milion – upgrade semnificativ de la M2.1


🎯 toolCalling Flag per model
Per-model toolCalling: true/false în registru — AutoCombo omite modelele care nu sunt compatibile cu instrumente


🌍 Detecția intenției multilingve
Cuvinte cheie PT/ZH/ES/AR în scorul AutoCombo — o selecție mai bună a modelului pentru conținut care nu este în limba engleză


📊 Backmark-uri bazate pe benchmark
Latența reală p95 de la solicitările live alimentează scorul combinat — AutoCombo învață din datele reale


🔁 Solicitare deduplicare
Fereastra de deduplicare bazată pe hash de conținut — sigură pentru mai mulți agenți, previne taxele duplicate


🔌 Pluggable RouterStrategy
Interfață extensibilă RouterStrategy — adăugați logica de rutare personalizată ca pluginuri



🚀 V2.0.9+ anterioară — Playground, CLI Fingerprints și ACP



Caracteristica
Ce face




🎮 Teren de joacă model
Pagina tabloului de bord pentru a testa orice model direct — selectoare furnizor/model/punct final, Editor Monaco, streaming, anulare, sincronizare


🔏 Potrivirea amprentei CLI
Ordinea antetului/corpului pentru fiecare furnizor pentru a se potrivi cu semnăturile CLI native - comutați pentru fiecare furnizor în Setări > Securitate. IP-ul dvs. proxy este păstrat


🤝 Suport ACP (Agent Client Protocol)
Descoperirea agentului CLI (Codex, Claude, Goose, Gemini CLI, OpenClaw + încă 9), generator de proces, punct final /api/acp/agents


🤖 Tabloul de bord pentru agenții ACP
Depanare › Pagina Agenți — grilă de 14 agenți cu starea instalării, versiunea, formularul de agent personalizat pentru orice instrument CLI. Utilizatorii OpenCode primesc un buton „Descărcați opencode.json” care generează automat o configurație gata de utilizare cu toate modelele disponibile.


🔧 Model personalizat apiFormat Rutare
Modelele personalizate cu apiFormat: "responses" sunt acum direcționate corect către traducătorul API de răspunsuri


🏢 Izolarea spațiului de lucru Codex
Spații de lucru Codex multiple per e-mail — OAuth separă corect conexiunile după ID-ul spațiului de lucru


🔄 Actualizare automată Electron
Aplicația desktop verifică actualizările + instalare automată la repornire



🤖 Operații cu agenți și protocol (v2.0)



Caracteristica
Ce face




🔧 Server MCP (16 instrumente)
Instrumente IDE/agent prin 3 transporturi: stdio, SSE (/api/mcp/sse), HTTP Streamable (/api/mcp/stream)


🤝 Server A2A (JSON-RPC + SSE)
Execuția sarcinilor de la agent la agent cu fluxuri de sincronizare și streaming


🧭 Pagină de puncte finale consolidate
Pagina de gestionare cu file cu file Endpoint Proxy, MCP, A2A și API Endpoints


🎚️ Servicii Activare/Dezactivare Comutări
Comutatoare ON/OFF pentru MCP și A2A cu persistența setărilor (implicit: OFF)


🛰️ MCP Runtime Heartbeat
Starea reală a procesului (pid, uptime, vârsta bătăilor inimii, transport, mod scope)


📋 MCP Audit Trail
Jurnale de audit filtrabile cu succes/eșec și atribuire cheie


🔐 MCP Scope Enforcement
9 permisiuni granulare pentru acces controlat la instrumente


📡 A2A Task Lifecycle Management
Listați/filtrați sarcinile, inspectați evenimentele/artefactele, anulați activitățile care rulează


📋 Descoperire card de agent
/.well-known/agent.json pentru descoperirea automată a clientului


🧪 Protocol E2E Test Harness
Real MCP SDK + A2A client flux în test:protocols:e2e


⚙️ Controale operaționale
Combo de comutare, aplicați profile de rezistență, resetați întrerupătoarele de pe o suprafață de control



🧠 Rutare și inteligență



Caracteristica
Ce face




🎯 Backback inteligent pe 4 niveluri
Rută automată: Abonament → Cheie API → Ieftin → Gratuit


📊 Urmărirea cotelor în timp real
Numărătoare de jetoane live + numărătoare inversă de resetare per furnizor


🔄 Traducerea formatului
OpenAI ↔ Claude ↔ Gemeni ↔ Răspunsuri cu conversii sigure pentru schema


👥 Asistență pentru mai multe conturi
Conturi multiple per furnizor cu selecție inteligentă


🔄 Reîmprospătare automată a simbolului
Tokenurile OAuth se reîmprospătează automat cu reîncercarea


🎨 Combinații personalizate
6 strategii de echilibrare + controlul lanțului de rezervă


🌐 Wildcard Router
provider/* rutare dinamică


🧠 Gândirea controalelor bugetare
Limite de raționament de trecere, automate, personalizate și adaptive


🔀 ** Aliasuri de model **
Aliasarea modelului încorporat + personalizat și siguranța migrării


⚡ Degradarea fundalului
Direcționați sarcinile de fundal cu prioritate redusă către modele mai ieftine


🧪 Rutare inteligentă în funcție de sarcini
Se selectează automat modelul după tipul de conținut (codificare/viziune/analiza/rezumat)


💬 System Prompt Injection
Controalele globale ale comportamentului aplicate în mod consecvent


📄 Responses API Compatibility
Suport complet /v1/responses pentru Codex și fluxuri de lucru agentice avansate



🎵 API-uri multimodale



Caracteristica
Ce face




🖼️ Generarea imaginii
/v1/images/generations cu cloud și backend locale


📐 Inglobări
/v1/embeddings pentru conducte de căutare și RAG


🎤 Transcriere audio
/v1/audio/transcriptions — 7 furnizori (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), detectarea automată a limbii, suport MP4/MP3/WAV


🔊 Text-to-speech
/v1/audio/speech — 10 furnizori (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) cu mesaje de eroare corecte


🎬 Generație video
/v1/videos/generations (fluxuri de lucru ComfyUI + SD WebUI)


🎵 Generație muzicală
/v1/music/generations (fluxuri de lucru ComfyUI)


🛡️ Moderații
/v1/moderations verificări de siguranță


🔀 Reclasificare
/v1/rerank pentru notarea relevanței


🔍 Căutare pe web 🆕
/v1/search — 5 furnizori (Serper, Brave, Perplexity, Exa, Tavily), peste 6.500 gratuit/lună, auto-failover, cache



🛡️ Reziliență, securitate și guvernanță



Caracteristica
Ce face




🔌 Întrerupătoare
Deplasare/recuperare per model cu controale de prag


🎯 Modele compatibile cu punctele finale
Modelele personalizate declară puncte finale acceptate + format API


🛡️ Turmă Anti-Tunete
Protecții Mutex + semafor la evenimentele de reîncercare/evaluare


🧠 Semantică + Cache de semnătură
Reducerea costului/latenței cu două straturi de cache


⚡ Solicita Idempotenta
Fereastra de protecție duplicată


🔒 TLS Fingerprint Spoofing
Amprenta digitală TLS asemănătoare unui browser — reduce detectarea botului și semnalizarea contului


🔏 Potrivirea amprentei CLI
Se potrivește cu semnăturile cererilor CLI native — reduce riscul de interzicere, păstrând IP-ul proxy


🌐 Filtrare IP
Controlul listei de permise/liste de blocare pentru implementările expuse


📊 Limite de rată editabile
Limite configurabile globale/la nivel de furnizor cu persistență


🔑 Administrarea cheilor API + Scoping
Emiterea/rotarea cheilor securizate și controale model/furnizor


🛡️ Protejat /models
Autentificare opțională și ascunderea furnizorului pentru catalogul de modele



📊 Observabilitate și analiză



Caracteristica
Ce face




📝 Solicitare + Înregistrare proxy
Cerere/răspuns complet și înregistrare proxy


📉 Streamed Detailed Logs 🆕
Reconstructs SSE payload streams cleanly into the UI


📋 Tabloul de bord pentru jurnalele unificate
Vizualizări de solicitare, proxy, audit și consolă într-o singură pagină


🔍 Solicitare telemetrie
latența p50/p95/p99 și urmărirea solicitărilor


🏥 Tabloul de bord pentru sănătate
Uptime, stări de întrerupere, blocări, statistici cache


💰 Urmărirea costurilor
Controalele bugetare și vizibilitatea prețurilor pe model


📈 Vizualizări de analiză
Informații despre utilizarea modelului/furnizorului și vizualizări ale tendințelor


🧪 Cadru de evaluare
Testarea setului de aur cu strategii de meci configurabile



☁️ Implementare și platformă



Caracteristica
Ce face




🌐 Implementează oriunde
Localhost, VPS, Docker, medii cloud


💾 Cloud Sync
Sincronizarea configurației prin cloud worker


🔄 Backup/Restaurare
Export/import și fluxuri de recuperare în caz de dezastru


🧙 Onboarding Wizard
Configurare ghidată pentru prima rulare


🔧 Tabloul de bord CLI Tools
Configurare cu un singur clic pentru instrumentele populare de codare


🎮 Teren de joacă model
Testați orice furnizor/model/punct final din tabloul de bord


🔏 CLI Fingerprint Toggle
Potrivirea amprentelor pentru fiecare furnizor în Setări > Securitate


🌐 i18n (30 de limbi)
Tabloul de bord complet + suport pentru limbajul documentelor cu acoperire RTL


🧹 Șterge toate modelele
Ștergerea listei de modele cu un singur clic în detaliile furnizorului


👁️ Sidebar Controls 🆕
Hide components and integrations from Appearance Settings


📋 Șabloane de probleme
Șabloane GitHub standardizate pentru erori și caracteristici


📂 Director de date personalizate
DATA_DIR anulează pentru locația de stocare



Caracteristică Deep Dive
Alternativ inteligent cu control practic al costurilor
Combo: "my-coding-stack"
  1. cc/claude-opus-4-6
  2. nvidia/llama-3.3-70b
  3. glm/glm-4.7
  4. if/kimi-k2-thinking
Când cota, rata sau starea de sănătate eșuează, OmniRoute trece automat la următorul candidat fără comutare manuală.
Managementul protocolului care este vizibil și operabil

MCP + A2A pot fi descoperite în UI și în documente (nu sunt ascunse)
API-urile privind starea protocolului expun date operaționale live (/api/mcp/*, /api/a2a/*)
Tablourile de bord includ acțiuni pentru operațiunile din a doua zi (comutații combo, resetări întrerupătoare, anularea sarcinilor)

Traducător + flux de lucru de validare
Zona Translator include:

Teren de joacă: solicitați verificări de transformare
Tester de chat: cerere/răspuns complet dus-întors
Bancul de testare: mai multe cazuri într-o singură cursă
Live Monitor: vizualizare în timp real a traficului

Plus validarea protocolului cu clienți reali prin npm run test:protocols:e2e.

📖 MCP Server README — Referință pentru instrumente, configurații IDE și exemple de clienți
📖 A2A Server README — Abilități, metode JSON-RPC, streaming și ciclul de viață al sarcinilor

🧪 Evaluări (Evaluări)
OmniRoute include un cadru de evaluare încorporat pentru a testa calitatea răspunsului LLM față de un set de aur. Accesați-l prin Analitice → Evaluări în tabloul de bord.
Set de aur încorporat
„Setul de aur OmniRoute” preîncărcat conține cazuri de testare pentru:

Salutări, matematică, geografie, generare de cod
Conformitatea formatului JSON, traducere, generare de reduceri
Refuz de siguranță (conținut nociv), numărare, logică booleană

Strategii de evaluare



Strategie
Descriere
Exemplu




exact
Ieșirea trebuie să se potrivească exact cu
"4"


contains
Ieșirea trebuie să conțină subșir (indiferență de majuscule și minuscule)
"Paris"


regex
Ieșirea trebuie să se potrivească cu modelul regex
"1.*2.*3"


custom
Funcția JS personalizată returnează adevărat/fals
(output) => output.length > 10




📖 Ghid de configurare
Configurare protocol (MCP + A2A)

🧩 Configurare MCP (Model Context Protocol)
Porniți transportul MCP în modul stdio:
omniroute --mcp
Flux de validare recomandat:

Conectați clientul MCP prin stdio.
Rulați omniroute_get_health.
Rulați omniroute_list_combos.
Deschideți /dashboard/mcp pentru a confirma bătăile inimii, activitatea și auditul.

API-uri utile pentru automatizare:

GET /api/mcp/status
GET /api/mcp/tools
GET /api/mcp/audit
GET /api/mcp/audit/stats



🤝 Configurare A2A (Agent2Agent)
Descoperiți agentul:
curl http://localhost:20128/.well-known/agent.json
Trimiteți o sarcină:
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'
Gestionați ciclul de viață:

GET /api/a2a/status
GET /api/a2a/tasks
GET /api/a2a/tasks/:id
POST /api/a2a/tasks/:id/cancel

Interfața de utilizare operațională:

/dashboard/a2a pentru observabilitate sarcini/stare/flux și acțiuni de fum



🧪 Validarea protocolului end-to-end
Validați ambele protocoale cu clienți reali:
npm run test:protocols:e2e
Aceasta verifică:

Conectare/lista/apelare client MCP SDK
A2A descoperire/trimitere/stream/obține/anulează
Verificați încrucișați datele în auditul MCP și API-urile de gestionare a sarcinilor A2A



💳 Furnizori de abonament
Cod Claude (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001
Sfat profesionist: Folosiți Opus pentru sarcini complexe, Sonnet pentru viteză. OmniRoute urmărește cota per model!
OpenAI Codex (Plus/Pro)
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max
Managementul limitelor contului Codex (5 ore + săptămânal)
Fiecare cont Codex are acum comutări de politică în Dashboard -> Providers:

5h (ON/OFF): aplicați politica privind pragul ferestrei de 5 ore.
Weekly (ON/OFF): aplicați politica săptămânală privind pragul ferestrei.
Comportamentul de prag: când o fereastră activată atinge >=90% utilizare, acel cont este omis.
Comportament de rotație: OmniRoute direcționează automat către următorul cont Codex eligibil.
Resetare comportament: când furnizorul resetAt trece timpul, contul devine din nou eligibil automat.

Scenarii:

5h ON + Weekly ON: contul este omis atunci când oricare dintre ferestre atinge pragul.
5h OFF + Weekly ON: numai utilizarea săptămânală poate bloca contul.
5h ON + Weekly OFF: doar utilizarea de 5 ore poate bloca contul.
resetAt trecut: contul reintră automat în rotație (fără reactivare manuală).

Gemini CLI (GRATIS 180K/lună!)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro
Cea mai bună valoare: Nivel gratuit imens! Folosiți-l înainte de nivelurile plătite.
GitHub Copilot
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro


🔑 Furnizori de chei API
NVIDIA NIM (acces GRATUIT pentru dezvoltatori — peste 70 de modele)

Înscrieți-vă: build.nvidia.com
Obțineți cheia API gratuită (1000 de credite de inferență incluse)
Tabloul de bord → Adăugați furnizor → NVIDIA NIM:

Cheie API: nvapi-your-key



Modele: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct și peste 50 de altele
Sfat profesional: API compatibil cu OpenAI - funcționează perfect cu traducerea formatului OmniRoute!
DeepSeek

Înscrieți-vă: platform.deepseek.com
Obțineți cheia API
Tabloul de bord → Adăugați furnizor → DeepSeek

Modele: deepseek/deepseek-chat, deepseek/deepseek-coder
Groq (nivel gratuit disponibil!)

Înscrieți-vă: console.groq.com
Obțineți cheia API (nivel gratuit inclus)
Tabloul de bord → Adăugați furnizor → Groq

Modele: groq/llama-3.3-70b, groq/mixtral-8x7b
Sfat profesionist: Inferență ultra-rapidă - cel mai bun pentru codare în timp real!
OpenRouter (100+ modele)

Înscrieți-vă: openrouter.ai
Obțineți cheia API
Tabloul de bord → Adăugare furnizor → OpenRouter

Modele: Accesați peste 100 de modele de la toți furnizorii importanți printr-o singură cheie API.


💰 Furnizori ieftini (backup)
GLM-4.7 (Resetare zilnică, 0,6 USD/1 milion)

Înscrieți-vă: Zhipu AI
Obțineți cheia API din Coding Plan
Tabloul de bord → Adăugați cheia API:

Furnizor: glm
Cheie API: your-key



Utilizați: glm/glm-4.7
Sfat profesionist: Planul de codare oferă cotă de 3 ori la 1/7 cost! Resetați zilnic la 10:00.
MiniMax M2.1 (resetare în 5 ore, 0,20 USD/1 milion)

Înscrieți-vă: MiniMax
Obțineți cheia API
Tabloul de bord → Adăugați cheia API

Utilizați: minimax/MiniMax-M2.1
Sfat pro: Cea mai ieftină opțiune pentru context lung (1 milion de jetoane)!
Kimi K2 (9 USD/lună fix)

Abonați-vă: Moonshot AI
Obțineți cheia API
Tabloul de bord → Adăugați cheia API

Utilizați: kimi/kimi-latest
Sfat profesionist: Fix 9 USD/lună pentru 10 milioane de jetoane = 0,90 USD/cost efectiv de 1 milion!


🆓 Furnizori GRATUITI (Backup de urgență)
iFlow (5 modele GRATUITE prin OAuth)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1
Qwen (4 modele GRATUITE prin codul dispozitivului)
Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash
Kiro (Claude GRATUIT)
Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5


🎨 Creați combinații
Exemplul 1: Maximizați abonamentul → Backup ieftin
Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding
Exemplul 2: Numai gratuit (cost zero)
Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!


🔧 Integrare CLI
Cursor IDE
Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6
Claude Cod
Utilizați pagina Instrumente CLI din tabloul de bord pentru configurarea cu un singur clic sau editați manual ~/.claude/settings.json.
Codex CLI
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"
OpenClaw
Opțiunea 1 — Tabloul de bord (recomandat):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Opțiunea 2 — Manual: Editați ~/.openclaw/openclaw.json:
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Notă: OpenClaw funcționează numai cu OmniRoute local. Utilizați 127.0.0.1 în loc de localhost pentru a evita problemele de rezoluție IPv6.

Cline / Continuare / RooCode
Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking
OpenCode
Pasul 1: Adăugați OmniRoute ca furnizor personalizat:
opencode
/connect
# Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key
Pasul 2: Creați/editați opencode.json în rădăcina proiectului dvs.:
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "omniroute": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OmniRoute",
      "options": {
        "baseURL": "http://localhost:20128/v1"
      },
      "models": {
        "cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
        "gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
        "if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
      }
    }
  }
}
Pasul 3: Selectați modelul în OpenCode:
/models
# Select any OmniRoute model from the list

Sfat: Adăugați orice model disponibil în punctul final OmniRoute /v1/models la secțiunea models. Utilizați formatul provider/model-id din tabloul de bord OmniRoute.



🐛 Depanare

Faceți clic pentru a extinde ghidul de depanare
„Modelul de limbă nu a furnizat mesaje”

Cota de furnizor epuizată → Verificați instrumentul de urmărire a cotei din tabloul de bord
Soluție: utilizați alternativă combinată sau treceți la un nivel mai ieftin

Limitarea ratei

Scăderea cotei de abonament → Fallback la GLM/MiniMax
Adăugați combo: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

Tokenul OAuth a expirat

Reîmprospătat automat de OmniRoute
Dacă problemele persistă: Dashboard → Provider → Reconnect

Costuri mari

Verificați statisticile de utilizare în Tabloul de bord → Costuri
Comutați modelul principal la GLM/MiniMax
Utilizați nivelul gratuit (Gemini CLI, iFlow) pentru sarcini necritice

Tabloul de bord/porturile API sunt greșite

PORT este portul de bază canonic (și portul API în mod implicit)
API_PORT suprascrie numai ascultatorul API compatibil cu OpenAI
DASHBOARD_PORT anulează numai tabloul de bord/ascultătorul Next.js
Setați NEXT_PUBLIC_BASE_URL la tabloul de bord/adresa URL publică (pentru apelurile inverse OAuth)

Erori de sincronizare în cloud

Verificați BASE_URL puncte către instanța dvs. care rulează
Verificați CLOUD_URL puncte către punctul final din cloud așteptat
Păstrați valorile NEXT_PUBLIC_* aliniate cu valorile de pe server

Prima conectare nu funcționează

Verificați INITIAL_PASSWORD în .env
Dacă nu este setată, parola de rezervă este 123456

Fără jurnal de solicitare

Setați ENABLE_REQUEST_LOGS=true în .env

Testul de conectare arată „Invalid” pentru furnizorii compatibili cu OpenAI

Mulți furnizori nu expun un punct final /models
OmniRoute v1.0.6+ include validarea de rezervă prin finalizarea chatului
Asigurați-vă că adresa URL de bază include sufixul /v1

🔐 OAuth pe un server la distanță



⚠️ Important pentru utilizatorii care rulează OmniRoute pe un VPS, Docker sau orice server la distanță

De ce eșuează Antigravity / Gemini CLI OAuth pe serverele de la distanță?
Furnizorii de Antigravity și Gemini CLI folosesc Google OAuth 2.0. Google necesită redirect_uri din fluxul OAuth pentru a se potrivi exact cu unul dintre URI-urile preînregistrate în Google Cloud Console a aplicației.
Acreditările OAuth incluse în OmniRoute sunt înregistrate doar pentru localhost. Când accesați OmniRoute pe un server la distanță (de exemplu, https://omniroute.myserver.com), Google respinge autentificarea cu:
Error 400: redirect_uri_mismatch
Soluție: Configurați propriile acreditări OAuth
Trebuie să creați un OAuth 2.0 Client ID în Google Cloud Console cu URI-ul serverului dvs.
Pas cu pas
1. Deschide Google Cloud Console
Accesați: https://console.cloud.google.com/apis/credentials
2. Creați un nou ID de client OAuth 2.0

Faceți clic pe "+ Creați acreditări" → "ID client OAuth"
Tip aplicație: "Aplicație web"
Nume: orice vă place (de exemplu, OmniRoute Remote)

3. Adăugați URI de redirecționare autorizate
În câmpul „URI-uri de redirecționare autorizate”, adăugați:
https://your-server.com/callback

Înlocuiți your-server.com cu domeniul sau IP-ul serverului dvs. (includeți portul dacă este necesar, de exemplu, http://45.33.32.156:20128/callback).

4. Salvați și copiați acreditările
După creare, Google va afișa Client ID și Client Secret.
5. Setați variabile de mediu
În .env (sau variabilele de mediu Docker):
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

# For Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
6. Reporniți OmniRoute
# npm:
npm run dev

# Docker:
docker restart omniroute
7. Încercați să vă conectați din nou
Tabloul de bord → Furnizori → Antigravity (sau Gemini CLI) → OAuth
Google va redirecționa acum corect către https://your-server.com/callback.

Soluție temporară (fără acreditări personalizate)
Dacă nu doriți să vă configurați propriile acreditări chiar acum, puteți utiliza în continuare fluxul manual de adrese URL:

OmniRoute deschide adresa URL de autorizare Google
După autorizare, Google încearcă să redirecționeze către localhost (care nu reușește pe serverul de la distanță)
Copiați adresa URL completă din bara de adrese a browserului dvs. (chiar dacă pagina nu se încarcă)
Lipiți acea adresă URL în câmpul afișat în modalul de conexiune OmniRoute
Faceți clic pe "Conectați"


Acest lucru funcționează deoarece codul de autorizare din URL este valid, indiferent dacă pagina de redirecționare a fost încărcată.



🇧🇷 Versão em Português
Por que o OAuth do Antigravity / Gemini CLI falha em serveres remotes?
Pentru autentificare, Antigravity și Gemini CLI folosesc Google OAuth 2.0. O Google exige que a redirect_uri utilizat nu fluxo OAuth seja exatamente uma das URIs pre-cadastradas no Google Cloud Console do aplicative.
As credenciais OAuth embutidas no OmniRoute esteão cadastradas apenas for localhost. Când accesați OmniRoute într-un server la distanță (ex: https://omniroute.meuservidor.com), sau Google respinge autentificarea com:
Error 400: redirect_uri_mismatch
Soluție: Configurați propriile acreditări OAuth
Você necesita criar um OAuth 2.0 Client ID nu Google Cloud Console ca URI pentru server.
Passo a passo
1. Acces sau Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Plângeți nou OAuth 2.0 Client ID

Faceți clic pe "+ Create Credentials" → "OAuth client ID"
Tip de aplicație: "Aplicație web"
Nume: scolha qualquer nome (ex: OmniRoute Remote)

3. Adăugați ca URI de redirecționare autorizate
No campo „URI-uri de redirecționare autorizate”, adiție:
https://seu-servidor.com/callback

Substitue seu-servidor.com pelo domínio sau IP do seu server (inclua a porta se necessário, ex: http://45.33.32.156:20128/callback).

4. Salve și copie ca credenciais
Após criar, o Google afișează o Client ID e o Client Secret.
5. Configurați ca variabile de mediu
Nu ai .env (ai variat de ambient do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
6. Reinicie o OmniRoute
# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute
7. Tente connect novamente
Tabloul de bord → Furnizori → Antigravity (sau Gemini CLI) → OAuth
Agora sau Google redirecționează corect pentru https://seu-servidor.com/callback și funcționează autenticação.

Soluție temporară (sem configura credenciais proprias)
Nu vă rugăm să vă convingeți acum, dar este posibil să utilizați sau să fluxați manual de URL:

OmniRoute deschide o adresă URL de autorizare Google
Após você autorizar, o Google tentará redirecionar para localhost (que falha no server remote)
Copiați o adresă URL completă da bara de accesare a browserului (mesmo que a page não carregue)
Cole essa URL nu există câmpuri care nu apar modal de conexão pentru OmniRoute
Faceți clic pe „Conectați-vă”


Această soluție de soluționare funcționează deoarece codul de autorizare a URL-ului este valabil independent de redirecționare pentru a încărca sau nu.




🛠️ Tech Stack

Faceți clic pentru a extinde detaliile tehnologice

Runtime: Node.js 18–22 LTS (⚠️ Node.js 24+ este nu este acceptat - better-sqlite3 binarele native sunt incompatibile)
Limba: TypeScript 5.9 — 100% TypeScript în src/ și open-sse/ (zero any în modulele de bază începând cu v2.0)
Cadru: Next.js 16 + React 19 + Tailwind CSS 4
Bază de date: LowDB (JSON) + SQLite (starea domeniului + jurnalele proxy + audit MCP + decizii de rutare)
Scheme: Zod (validare I/O instrument MCP, contracte API)
Protocoale: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
Streaming: evenimente trimise de server (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + Chei API + Autorizare MCP
Testare: Runner de testare Node.js + Vitest (900+ teste inclusiv unitate, integrare, E2E)
CI/CD: GitHub Actions (publicare automată npm + Docker Hub la lansare)
Site web: omniroute.online
Pachet: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Reziliență: întrerupător de circuit, backoff exponențial, turmă anti-tunet, falsificare TLS, auto-vindecare combo



📖 Documentație



Document
Descriere




User Guide
Furnizori, combo-uri, integrare CLI, implementare


API Reference
Toate punctele finale cu exemple


MCP Server
16 instrumente MCP, configurații IDE, clienți Python/TS/Go


A2A Server
Protocol JSON-RPC 2.0, abilități, streaming, gestionarea sarcinilor


Auto-Combo Engine
Scor în 6 factori, pachete de moduri, auto-vindecare


Troubleshooting
Probleme și soluții comune


Architecture
Arhitectura sistemului și elementele interne


Contributing
Configurare și linii directoare de dezvoltare


OpenAPI Spec
Specificație OpenAPI 3.0


Security Policy
Raportarea vulnerabilităților și practicile de securitate


VM Deployment
Ghid complet: VM + nginx + configurare Cloudflare


Features Gallery
Tur vizual al tabloului de bord cu capturi de ecran


Release Checklist
Pașii de validare înainte de lansare




🗺️ Foaia de parcurs
OmniRoute are 210+ funcții planificate în mai multe faze de dezvoltare. Iată domeniile cheie:



Categoria
Caracteristici planificate
Repere




🧠 Routing & Intelligence
25+
Rutare cu cea mai mică latență, rutare bazată pe etichete, verificare preliminară a cotei, selecție contului P2C


🔒 Securitate și conformitate
20+
Întărirea SSRF, acoperirea acreditărilor, limita de rată per punct final, domeniul de aplicare al cheii de management


📊 Observabilitate
15+
Integrarea OpenTelemetry, monitorizarea cotelor în timp real, urmărirea costurilor per model


🔄 Integrări furnizori
20+
Registrul modelului dinamic, perioadele de încărcare ale furnizorului, Codexul cu mai multe conturi, analiza cotelor Copilot


⚡ Performanță
15+
Strat cache dublu, cache prompt, cache de răspuns, streaming keepalive, API batch


🌐 Ecosistem
10+
WebSocket API, config hot-reload, magazin de configurare distribuit, mod comercial



🔜 În curând

🔗 Integrare OpenCode — Suport furnizor nativ pentru IDE-ul de codare OpenCode AI
🔗 Integrare TRAE — Suport complet pentru cadrul de dezvoltare TRAE AI
📦 Batch API — Procesare asincronă în lot pentru solicitări în bloc
🎯 Rutare bazată pe etichete — Solicitări de rutare bazate pe etichete și metadate personalizate
💰 Strategia cu cel mai mic cost — Selectați automat cel mai ieftin furnizor disponibil


📝 Specificații complete ale caracteristicilor disponibile în OMNI_TOKEN_342 (217 specificații detaliate)


👥 Colaboratori

Cum să contribui

Bifurcați depozitul
Creați-vă ramura caracteristică (git checkout -b feature/amazing-feature)
Afișează modificările (git commit -m 'Add amazing feature')
Apăsați la ramură (git push origin feature/amazing-feature)
Deschideți o cerere de tragere

Consultați CONTRIBUTING.md pentru instrucțiuni detaliate.
Lansarea unei noi versiuni
# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes

📊 Istoria stelelor
Observatorii stelelor de-a lungul timpului

🙏 Mulțumiri
Mulțumiri speciale pentru 9router de decolua — proiectul original care a inspirat această furcă. OmniRoute se bazează pe această bază incredibilă cu funcții suplimentare, API-uri multimodale și o rescrie completă TypeScript.
Mulțumiri speciale pentru CLIProxyAPI — implementarea Go originală care a inspirat acest port JavaScript.

📄 Licență
Licență MIT - consultați LICENSE pentru detalii.


  _{Construit cu ❤️ pentru dezvoltatorii care codifică 24/7}
  

  _{omniroute.online}

Pasul	Acțiune	Furnizori deblocați
1	Conectați Kiro (AWS Builder ID OAuth)	Claude Sonnet 4.5, Haiku 4.5 — nelimitat
2	Conectați iFlow (Google OAuth)	kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... — nelimitat
3	Conectați Qwen (Codul dispozitivului)	qwen3-coder-plus, qwen3-coder-flash... — nelimitat
4	Conectați Gemini CLI (Google OAuth)	gemini-3-flash, gemini-2.5-pro — 180K/lună gratuit
5	`/dashboard/combos` → șablon Stiva gratuită ($0)	Round-robin toți furnizorii gratuiti în mod automat

Model	Prefix	Limită	Limită de rată
`claude-sonnet-4.5`	`kr/`	Nelimitat	Niciun plafon zilnic raportat
`claude-haiku-4.5`	`kr/`	Nelimitat	Niciun plafon zilnic raportat
`claude-opus-4.6`	`kr/`	Nelimitat	Ultimul Opus prin Kiro

Model	Prefix	Limită	Limită de rată
`kimi-k2-thinking`	`if/`	Nelimitat	Nicio limită raportată
`qwen3-coder-plus`	`if/`	Nelimitat	Nicio limită raportată
`deepseek-r1`	`if/`	Nelimitat	Nicio limită raportată
`minimax-m2.1`	`if/`	Nelimitat	Nicio limită raportată
`kimi-k2`	`if/`	Nelimitat	Nicio limită raportată

Model	Prefix	Limită	Limită de rată
`qwen3-coder-plus`	`qw/`	Nelimitat	Nicio limită raportată
`qwen3-coder-flash`	`qw/`	Nelimitat	Nicio limită raportată
`qwen3-coder-next`	`qw/`	Nelimitat	Nicio limită raportată
`vision-model`	`qw/`	Nelimitat	Multimodal (imagini)

Furnizor	Credite gratuite	Cel mai bun model	Limită de rată
🟢 Deepgram	200 USD gratuit (înscriere)	`nova-3` — cea mai bună acuratețe, peste 30 de limbi	Fără limită RPM pentru creditele gratuite
🔵 AsamblareAI	50 USD gratuit (înscriere)	`universal-3-pro` — capitole, sentiment, PII	Fără limită RPM pentru creditele gratuite
🔴 Groq	Gratuit pentru totdeauna	`whisper-large-v3` — OpenAI Whisper	30 RPM (rată limitată)

Comanda	Descriere
`omniroute`	Porniți serverul (`PORT=20128`, API și tabloul de bord pe același port)
`omniroute --port 3000`	Setați portul canonic/API la 3000
`omniroute --mcp`	Porniți serverul MCP (transport stdio)
`omniroute --no-open`	Nu deschideți automat browserul
`omniroute --help`	Arată ajutor

Imagine	Etichetă	Dimensiune	Descriere
`diegosouzapw/omniroute`	`latest`	~250MB	Ultima versiune stabilă
`diegosouzapw/omniroute`	`1.0.3`	~250MB	Versiunea curentă

Nivelul	Furnizor	Cost	Resetare cotă	Cel mai bun pentru
💳 ABONAMENT	Claude Code (Pro)	20 USD/lună	5h + săptămânal	Deja abonat
	Codex (Plus/Pro)	20-200 USD/lună	5h + săptămânal	Utilizatori OpenAI
	Gemeni CLI	GRATIS	180K/lună + 1K/zi	Toată lumea!
	GitHub Copilot	10-19 USD/lună	Lunar	utilizatorii GitHub
🔑 CHEIA API	NVIDIA NIM	GRATIS (dev forever)	~40 RPM	70+ modele deschise
	Cerebre	GRATIS (1M tok/zi)	60K TPM / 30 RPM	Cel mai rapid din lume
	Groq	GRATIS (30 RPM)	14,4K RPD	Llama/Gemma ultra-rapidă
	DeepSeek V3.2	0,27 USD/1,10 USD per 1 milion	Niciuna	Cel mai bun raționament preț/calitate
	xAI Grok-4 Fast	0,20 USD/0,50 USD pe 1M 🆕	Niciuna	Cea mai rapidă + apelare instrument, ultralow
	xAI Grok-4 (standard)	0,20 USD/1,50 USD per 1 milion 🆕	Niciuna	Raționamentul emblematic de la xAI
	Mistral	Probă gratuită + plătit	Tarif limitat	IA europeană
	OpenRouter	Plată-pe-utilizare	Niciuna	100+ modele agr.
💰 IEFTIN	GLM-5 (prin Z.AI) 🆕	0,5 USD/1 milion	Zilnic 10:00	Ieșire 128K, cel mai nou flagship
	GLM-4.7	0,6 USD/1 milion	Zilnic 10:00	Backup buget
	MiniMax M2.5 🆕	Intrare de 0,3 USD/1 milion	rulare de 5 ore	Raționament + sarcini agentice
	MiniMax M2.1	0,2 USD/1 milion	rulare de 5 ore	Cea mai ieftină opțiune
	Kimi K2.5 (API Moonshot) 🆕	Plată-pe-utilizare	Niciuna	Acces direct API Moonshot
	Kimi K2	9 USD/lună plat	10 milioane de jetoane/lună	Cost previzibil
🆓 GRATUIT	iFlow	$0	Nelimitat	5 modele nelimitat
	Qwen	$0	Nelimitat	4 modele nelimitat
	Kiro	$0	Nelimitat	Claude Sonnet/Haiku (AWS Builder)
	LongCat Flash-Lite 🆕	$0 (50 M tok/zi 🔥)	1 RPS	Cea mai mare cotă gratuită de pe Pământ
	Polenizări AI 🆕	$0 (nu este nevoie de cheie)	1 solicitat/15s	GPT-5, Claude, DeepSeek, Llama 4
	Cloudflare Workers AI 🆕	$0 (10K Neuroni/zi)	~150 resp/zi	50+ modele, avantaj global
	Scaleway AI 🆕	$0 (1 milion de jetoane în total)	Tarif limitat	UE/GDPR, Qwen3 235B, Llama 70B

Model	Prefix	Limită	Limită de rată
`gemini-3-flash-preview`	`gc/`	180K tok/lună + 1K/zi	Resetare lunară
`gemini-2.5-pro`	`gc/`	180K/lună (piscina comună)	Calitate înaltă

Model	Prefix	Cotă zilnică gratuită	Note
`LongCat-Flash-Lite`	`lc/`	50M de jetoane 💥	Cea mai mare cotă gratuită vreodată
`LongCat-Flash-Chat`	`lc/`	500K jetoane	Chat în mai multe rânduri
`LongCat-Flash-Thinking`	`lc/`	500K jetoane	Raționament / CoT
`LongCat-Flash-Thinking-2601`	`lc/`	500K jetoane	Versiunea ianuarie 2026
`LongCat-Flash-Omni-2603`	`lc/`	500K jetoane	Multimodal

Model	Prefix	Limită de rată	Furnizor în spatele
`openai`	`pol/`	1 solicitat/15s	GPT-5
`claude`	`pol/`	1 solicitat/15s	Claude antropic
`gemini`	`pol/`	1 solicitat/15s	Google Gemeni
`deepseek`	`pol/`	1 solicitat/15s	DeepSeek V3
`llama`	`pol/`	1 solicitat/15s	Meta Llama 4 Scout
`mistral`	`pol/`	1 solicitat/15s	Mistral AI

Caracteristica	Ce face
⚡ Grok-4 Fast Family	Modele xAI la 0,20 USD/0,50 USD/M — etalon de 1143 ms (30% mai rapid decât Gemini 2.5 Flash)
🧠 GLM-5 prin Z.AI	Context de ieșire de 128.000, 0,5 USD/1 milion — cel mai nou flagship din familia GLM
🔮 MiniMax M2.5	Raționament + sarcini agentice la 0,30 USD/1 milion – upgrade semnificativ de la M2.1
🎯 toolCalling Flag per model	Per-model `toolCalling: true/false` în registru — AutoCombo omite modelele care nu sunt compatibile cu instrumente
🌍 Detecția intenției multilingve	Cuvinte cheie PT/ZH/ES/AR în scorul AutoCombo — o selecție mai bună a modelului pentru conținut care nu este în limba engleză
📊 Backmark-uri bazate pe benchmark	Latența reală p95 de la solicitările live alimentează scorul combinat — AutoCombo învață din datele reale
🔁 Solicitare deduplicare	Fereastra de deduplicare bazată pe hash de conținut — sigură pentru mai mulți agenți, previne taxele duplicate
🔌 Pluggable RouterStrategy	Interfață extensibilă `RouterStrategy` — adăugați logica de rutare personalizată ca pluginuri

Caracteristica	Ce face
🎮 Teren de joacă model	Pagina tabloului de bord pentru a testa orice model direct — selectoare furnizor/model/punct final, Editor Monaco, streaming, anulare, sincronizare
🔏 Potrivirea amprentei CLI	Ordinea antetului/corpului pentru fiecare furnizor pentru a se potrivi cu semnăturile CLI native - comutați pentru fiecare furnizor în Setări > Securitate. IP-ul dvs. proxy este păstrat
🤝 Suport ACP (Agent Client Protocol)	Descoperirea agentului CLI (Codex, Claude, Goose, Gemini CLI, OpenClaw + încă 9), generator de proces, punct final `/api/acp/agents`
🤖 Tabloul de bord pentru agenții ACP	Depanare › Pagina Agenți — grilă de 14 agenți cu starea instalării, versiunea, formularul de agent personalizat pentru orice instrument CLI. Utilizatorii OpenCode primesc un buton „Descărcați opencode.json” care generează automat o configurație gata de utilizare cu toate modelele disponibile.
🔧 Model personalizat `apiFormat` Rutare	Modelele personalizate cu `apiFormat: "responses"` sunt acum direcționate corect către traducătorul API de răspunsuri
🏢 Izolarea spațiului de lucru Codex	Spații de lucru Codex multiple per e-mail — OAuth separă corect conexiunile după ID-ul spațiului de lucru
🔄 Actualizare automată Electron	Aplicația desktop verifică actualizările + instalare automată la repornire

Caracteristica	Ce face
🔧 Server MCP (16 instrumente)	Instrumente IDE/agent prin 3 transporturi: stdio, SSE (`/api/mcp/sse`), HTTP Streamable (`/api/mcp/stream`)
🤝 Server A2A (JSON-RPC + SSE)	Execuția sarcinilor de la agent la agent cu fluxuri de sincronizare și streaming
🧭 Pagină de puncte finale consolidate	Pagina de gestionare cu file cu file Endpoint Proxy, MCP, A2A și API Endpoints
🎚️ Servicii Activare/Dezactivare Comutări	Comutatoare ON/OFF pentru MCP și A2A cu persistența setărilor (implicit: OFF)
🛰️ MCP Runtime Heartbeat	Starea reală a procesului (pid, uptime, vârsta bătăilor inimii, transport, mod scope)
📋 MCP Audit Trail	Jurnale de audit filtrabile cu succes/eșec și atribuire cheie
🔐 MCP Scope Enforcement	9 permisiuni granulare pentru acces controlat la instrumente
📡 A2A Task Lifecycle Management	Listați/filtrați sarcinile, inspectați evenimentele/artefactele, anulați activitățile care rulează
📋 Descoperire card de agent	`/.well-known/agent.json` pentru descoperirea automată a clientului
🧪 Protocol E2E Test Harness	Real MCP SDK + A2A client flux în `test:protocols:e2e`
⚙️ Controale operaționale	Combo de comutare, aplicați profile de rezistență, resetați întrerupătoarele de pe o suprafață de control

Caracteristica	Ce face
🎯 Backback inteligent pe 4 niveluri	Rută automată: Abonament → Cheie API → Ieftin → Gratuit
📊 Urmărirea cotelor în timp real	Numărătoare de jetoane live + numărătoare inversă de resetare per furnizor
🔄 Traducerea formatului	OpenAI ↔ Claude ↔ Gemeni ↔ Răspunsuri cu conversii sigure pentru schema
👥 Asistență pentru mai multe conturi	Conturi multiple per furnizor cu selecție inteligentă
🔄 Reîmprospătare automată a simbolului	Tokenurile OAuth se reîmprospătează automat cu reîncercarea
🎨 Combinații personalizate	6 strategii de echilibrare + controlul lanțului de rezervă
🌐 Wildcard Router	`provider/*` rutare dinamică
🧠 Gândirea controalelor bugetare	Limite de raționament de trecere, automate, personalizate și adaptive
🔀 Aliasuri de model	Aliasarea modelului încorporat + personalizat și siguranța migrării
⚡ Degradarea fundalului	Direcționați sarcinile de fundal cu prioritate redusă către modele mai ieftine
🧪 Rutare inteligentă în funcție de sarcini	Se selectează automat modelul după tipul de conținut (codificare/viziune/analiza/rezumat)
💬 System Prompt Injection	Controalele globale ale comportamentului aplicate în mod consecvent
📄 Responses API Compatibility	Suport complet `/v1/responses` pentru Codex și fluxuri de lucru agentice avansate

Caracteristica	Ce face
🖼️ Generarea imaginii	`/v1/images/generations` cu cloud și backend locale
📐 Inglobări	`/v1/embeddings` pentru conducte de căutare și RAG
🎤 Transcriere audio	`/v1/audio/transcriptions` — 7 furnizori (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), detectarea automată a limbii, suport MP4/MP3/WAV
🔊 Text-to-speech	`/v1/audio/speech` — 10 furnizori (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) cu mesaje de eroare corecte
🎬 Generație video	`/v1/videos/generations` (fluxuri de lucru ComfyUI + SD WebUI)
🎵 Generație muzicală	`/v1/music/generations` (fluxuri de lucru ComfyUI)
🛡️ Moderații	`/v1/moderations` verificări de siguranță
🔀 Reclasificare	`/v1/rerank` pentru notarea relevanței
🔍 Căutare pe web 🆕	`/v1/search` — 5 furnizori (Serper, Brave, Perplexity, Exa, Tavily), peste 6.500 gratuit/lună, auto-failover, cache

Caracteristica	Ce face
🔌 Întrerupătoare	Deplasare/recuperare per model cu controale de prag
🎯 Modele compatibile cu punctele finale	Modelele personalizate declară puncte finale acceptate + format API
🛡️ Turmă Anti-Tunete	Protecții Mutex + semafor la evenimentele de reîncercare/evaluare
🧠 Semantică + Cache de semnătură	Reducerea costului/latenței cu două straturi de cache
⚡ Solicita Idempotenta	Fereastra de protecție duplicată
🔒 TLS Fingerprint Spoofing	Amprenta digitală TLS asemănătoare unui browser — reduce detectarea botului și semnalizarea contului
🔏 Potrivirea amprentei CLI	Se potrivește cu semnăturile cererilor CLI native — reduce riscul de interzicere, păstrând IP-ul proxy
🌐 Filtrare IP	Controlul listei de permise/liste de blocare pentru implementările expuse
📊 Limite de rată editabile	Limite configurabile globale/la nivel de furnizor cu persistență
🔑 Administrarea cheilor API + Scoping	Emiterea/rotarea cheilor securizate și controale model/furnizor
🛡️ Protejat `/models`	Autentificare opțională și ascunderea furnizorului pentru catalogul de modele

Caracteristica	Ce face
📝 Solicitare + Înregistrare proxy	Cerere/răspuns complet și înregistrare proxy
📉 Streamed Detailed Logs 🆕	Reconstructs SSE payload streams cleanly into the UI
📋 Tabloul de bord pentru jurnalele unificate	Vizualizări de solicitare, proxy, audit și consolă într-o singură pagină
🔍 Solicitare telemetrie	latența p50/p95/p99 și urmărirea solicitărilor
🏥 Tabloul de bord pentru sănătate	Uptime, stări de întrerupere, blocări, statistici cache
💰 Urmărirea costurilor	Controalele bugetare și vizibilitatea prețurilor pe model
📈 Vizualizări de analiză	Informații despre utilizarea modelului/furnizorului și vizualizări ale tendințelor
🧪 Cadru de evaluare	Testarea setului de aur cu strategii de meci configurabile

Caracteristica	Ce face
🌐 Implementează oriunde	Localhost, VPS, Docker, medii cloud
💾 Cloud Sync	Sincronizarea configurației prin cloud worker
🔄 Backup/Restaurare	Export/import și fluxuri de recuperare în caz de dezastru
🧙 Onboarding Wizard	Configurare ghidată pentru prima rulare
🔧 Tabloul de bord CLI Tools	Configurare cu un singur clic pentru instrumentele populare de codare
🎮 Teren de joacă model	Testați orice furnizor/model/punct final din tabloul de bord
🔏 CLI Fingerprint Toggle	Potrivirea amprentelor pentru fiecare furnizor în Setări > Securitate
🌐 i18n (30 de limbi)	Tabloul de bord complet + suport pentru limbajul documentelor cu acoperire RTL
🧹 Șterge toate modelele	Ștergerea listei de modele cu un singur clic în detaliile furnizorului
👁️ Sidebar Controls 🆕	Hide components and integrations from Appearance Settings
📋 Șabloane de probleme	Șabloane GitHub standardizate pentru erori și caracteristici
📂 Director de date personalizate	`DATA_DIR` anulează pentru locația de stocare

Strategie	Descriere	Exemplu
`exact`	Ieșirea trebuie să se potrivească exact cu	`"4"`
`contains`	Ieșirea trebuie să conțină subșir (indiferență de majuscule și minuscule)	`"Paris"`
`regex`	Ieșirea trebuie să se potrivească cu modelul regex	`"1.2.3"`
`custom`	Funcția JS personalizată returnează adevărat/fals	`(output) => output.length > 10`

Document	Descriere
User Guide	Furnizori, combo-uri, integrare CLI, implementare
API Reference	Toate punctele finale cu exemple
MCP Server	16 instrumente MCP, configurații IDE, clienți Python/TS/Go
A2A Server	Protocol JSON-RPC 2.0, abilități, streaming, gestionarea sarcinilor
Auto-Combo Engine	Scor în 6 factori, pachete de moduri, auto-vindecare
Troubleshooting	Probleme și soluții comune
Architecture	Arhitectura sistemului și elementele interne
Contributing	Configurare și linii directoare de dezvoltare
OpenAPI Spec	Specificație OpenAPI 3.0
Security Policy	Raportarea vulnerabilităților și practicile de securitate
VM Deployment	Ghid complet: VM + nginx + configurare Cloudflare
Features Gallery	Tur vizual al tabloului de bord cu capturi de ecran
Release Checklist	Pașii de validare înainte de lansare

Categoria	Caracteristici planificate	Repere
🧠 Routing & Intelligence	25+	Rutare cu cea mai mică latență, rutare bazată pe etichete, verificare preliminară a cotei, selecție contului P2C
🔒 Securitate și conformitate	20+	Întărirea SSRF, acoperirea acreditărilor, limita de rată per punct final, domeniul de aplicare al cheii de management
📊 Observabilitate	15+	Integrarea OpenTelemetry, monitorizarea cotelor în timp real, urmărirea costurilor per model
🔄 Integrări furnizori	20+	Registrul modelului dinamic, perioadele de încărcare ale furnizorului, Codexul cu mai multe conturi, analiza cotelor Copilot
⚡ Performanță	15+	Strat cache dublu, cache prompt, cache de răspuns, streaming keepalive, API batch
🌐 Ecosistem	10+	WebSocket API, config hot-reload, magazin de configurare distribuit, mod comercial

109 KiB Raw Blame History Unescape Escape

🚀 OmniRoute — Gateway-ul gratuit AI

Nu opriți niciodată codificarea. Dirijare inteligentă către modele AI GRATUITE și cu costuri reduse cu rezervă automată.

🆕 Ce este nou în v3.0.0

🖼️ Tabloul de bord principal

📸 Previzualizarea tabloului de bord

🤖 Furnizor AI gratuit pentru agenții tăi preferați de codare

🤔 De ce OmniRoute?

📧 Suport

🐛 Raportați o eroare?

🔄 Cum funcționează

🎯 Ce rezolvă OmniRoute — 30 de puncte reale de durere și cazuri de utilizare

Exemple de manuale (cazuri de utilizare integrate)

🆓 Începe gratuit — Cost de configurare zero

⚡ Pornire rapidă

1) Instalați și rulați

2) Conectați furnizorii și creați-vă cheia API

3) Îndreptați instrumentul de codare către OmniRoute

4) Activați și validați protocoalele (v2.0)

5) Validați totul de la capăt la capăt (recomandat)

Alternativă: rulează de la sursă

🐳 Docker

🖥️ Aplicație desktop — Offline și mereu activată

Pornire rapidă

Tava de sistem

💰 Prețurile dintr-o privire

🆓 Modele gratuite — Ce obțineți de fapt

🔵 MODELE CLAUDE (prin Kiro — AWS Builder ID)

🟢 MODELE IFLOW (OAuth gratuit — fără card de credit)

🟡 MODELE QWEN (Autentificare cod dispozitiv)

🟣 GEMINI CLI (Google OAuth)

⚫ NVIDIA NIM (Cheie API gratuită — build.nvidia.com)

⚪ CEREBRAS (Cheie API gratuită — inference.cerebras.ai)

🔴 GROQ (Cheie API gratuită — console.groq.com)

🔴 LONGCAT AI (Cheie API gratuită — longcat.chat) 🆕

🟢 POLLINATIONS AI (Nu este necesară nicio cheie API) 🆕

🟠 CLOUDFLARE WORKERS AI (Cheie API gratuită — cloudflare.com) 🆕

🟣 SCALEWAY AI (1 milion de jetoane gratuite — scaleway.com) 🆕

🎙️ Combo de transcriere gratuită

💡 Caracteristici cheie

🆕 Nou — Îmbunătățiri inspirate de ClawRouter (martie 2026)

🚀 V2.0.9+ anterioară — Playground, CLI Fingerprints și ACP

🤖 Operații cu agenți și protocol (v2.0)

🧠 Rutare și inteligență

🎵 API-uri multimodale

🛡️ Reziliență, securitate și guvernanță

📊 Observabilitate și analiză

☁️ Implementare și platformă

Caracteristică Deep Dive

Alternativ inteligent cu control practic al costurilor

Managementul protocolului care este vizibil și operabil

Traducător + flux de lucru de validare

🧪 Evaluări (Evaluări)

Set de aur încorporat

Strategii de evaluare

📖 Ghid de configurare

Configurare protocol (MCP + A2A)

Cod Claude (Pro/Max)

OpenAI Codex (Plus/Pro)

Managementul limitelor contului Codex (5 ore + săptămânal)

Gemini CLI (GRATIS 180K/lună!)

GitHub Copilot

NVIDIA NIM (acces GRATUIT pentru dezvoltatori — peste 70 de modele)

DeepSeek

Groq (nivel gratuit disponibil!)

OpenRouter (100+ modele)

GLM-4.7 (Resetare zilnică, 0,6 USD/1 milion)

MiniMax M2.1 (resetare în 5 ore, 0,20 USD/1 milion)

Kimi K2 (9 USD/lună fix)

iFlow (5 modele GRATUITE prin OAuth)

Qwen (4 modele GRATUITE prin codul dispozitivului)

Kiro (Claude GRATUIT)

Exemplul 1: Maximizați abonamentul → Backup ieftin

Exemplul 2: Numai gratuit (cost zero)

Cursor IDE

Claude Cod

Codex CLI

OpenClaw

Cline / Continuare / RooCode

OpenCode

109 KiB

Raw Blame History