mirror of https://github.com/diegosouzapw/OmniRoute.git synced 2026-05-06 02:07:00 +00:00

diegosouzapw b84e79362e docs: sync v3.2.6 features across 30 languages (README + FEATURES)

2026-03-29 05:32:01 -03:00

108 KiB

Raw Blame History

🚀 OmniRoute — bezplatná brána umělé inteligence

Nikdy nepřestávejte kódovat. Chytré směrování na BEZPLATNÉ a levné modely s umělou inteligencí s automatickým zálohováním.

Váš univerzální API proxy – jeden koncový bod, 67+ poskytovatelů, nulové prostoje. Nyní s orchestrací agentů MCP & A2A.

Dokončení chatu • Vložení • Generování obrázků • Video • Hudba • Zvuk • Změna pořadí • Vyhledávání na webu • Server MCP • Protokol A2A • 100% TypeScript

🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp

🆕 Co je nového ve verzi 3.0.0

Upgrade z verze 2.9.5? — Všechny změny najdete v full CHANGELOG.

Oblast	Změnit
🔒 Zabezpečení CodeQL	Opraveno 10+ upozornění CodeQL: polynomial-redos, nejistá náhodnost, náprava shell-injection
✅ Ověření trasy	Všech 176 tras API je nyní ověřeno pomocí schémat Zod + `validateBody()` – průkazy CI `check:route-validation:t06`
🐛 omniModel Tag Leak	Interní značky `<omniModel>` již neunikají klientům v odpovědích streamování SSE (#585)
🔑 Registered Keys API	Klíče API pro automatické poskytování prostřednictvím `POST /api/v1/registered-keys` s vynucováním kvót pro jednotlivé poskytovatele/účty, idempotence, úložiště SHA-256 a volitelné hlášení problémů GitHub
👁️ Scoped API Key Reveal 🆕	Opt-in recovery of API keys via `ALLOW_API_KEY_REVEAL`
🎨 Ikony poskytovatelů	Více než 130 log poskytovatelů prostřednictvím `@lobehub/icons` (SVG) s PNG → obecný záložní řetězec
🔄 Automatická synchronizace modelu	24h plánovač a ruční přepínání uživatelského rozhraní pro synchronizaci seznamů modelů pro vestavěné a vlastní poskytovatele kompatibilní s OpenAI
🌐 OpenCode Zen/Go	Dva noví poskytovatelé od @kang-heewon prostřednictvím PR #530: úroveň zdarma + úroveň předplatného přes `OpencodeExecutor`
🐛 Gemini CLI OAuth	Akční chyba, když v Dockeru chybí `GEMINI_OAUTH_CLIENT_SECRET` (byla záhadná chyba Google)
🐛 Konfigurace OpenCode	`saveOpenCodeConfig()` nyní správně zapisuje TOML do `XDG_CONFIG_HOME`
🐛 Přepsání připnutého modelu	`body.model` správně nastaveno na `pinnedModel` při ochraně kontextové mezipaměti
🐛 Codex/Claude loop	`tool_result` bloky nyní převedeny na text pro zastavení nekonečných smyček
🐛 Přesměrování přihlášení	Přihlášení již nezamrzá po přeskočení nastavení hesla
🐛 Cesty systému Windows	Cesty MSYS2/Git-Bash (`/c/...`) automaticky normalizovány na `C:\...`

🖼️ Hlavní panel

📸 Náhled řídicího panelu

Kliknutím zobrazíte snímky obrazovky řídicího panelu

Strana	Snímek obrazovky
Poskytovatelé
Komba
Analytika
Zdraví
Překladatel
Nastavení
Nástroje CLI
Protokoly použití
Koncové body

🤖 Bezplatný poskytovatel AI pro vaše oblíbené kódovací agenty

Připojte jakýkoli nástroj IDE nebo CLI s umělou inteligencí prostřednictvím OmniRoute – bezplatné brány API pro neomezené kódování.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Všichni agenti se připojují přes http://localhost:20128/v1 nebo http://cloud.omniroute_ONline_CSNI_TOK one/v6 modely a kvóta}



🤔 Proč OmniRoute?
Přestaňte plýtvat penězi a narážet na limity:

 Kvóta předplatného vyprší nevyužita každý měsíc
 Sazbové limity vás zastaví uprostřed kódování
 drahá rozhraní API (20–50 USD měsíčně na poskytovatele)
 Ruční přepínání mezi poskytovateli

OmniRoute to řeší:

✅ Maximalizujte odběry - Sledujte kvótu, před resetováním použijte každý bit
✅ Automatická záloha - Předplatné → Klíč API → Levné → Zdarma, nulové prostoje
✅ Více účtů - Round-robin mezi účty na poskytovatele
✅ Universal - Funguje s Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, jakýmkoliv nástrojem CLI


📧 Podpora

💬 Připojte se k naší komunitě! WhatsApp Group — Získejte pomoc, sdílejte tipy a buďte informováni.


Web: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Problémy: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community Group
Přispívání: Podívejte se na CONTRIBUTING.md, otevřete PR nebo si vyberte good first issue
Původní projekt: 9router by decolua

🐛 Nahlásit chybu?
Při otevírání problému spusťte příkaz system-info a připojte vygenerovaný soubor:
npm run system-info
Tím se vygeneruje system-info.txt s vaší verzí Node.js, verzí OmniRoute, podrobnostmi OS, nainstalovanými nástroji CLI (iflow, gemini, claude, codex, antigravity, droid atd.), stavem Docker/PM2 a systémovými balíčky – vše, co potřebujeme k rychlé reprodukci vašeho problému. Připojte soubor přímo k vašemu problému na GitHubu.

🔄 Jak to funguje
┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

🎯 Co řeší OmniRoute — 30 bodů skutečné bolesti a případy použití

Každý vývojář používající nástroje AI čelí těmto problémům denně. OmniRoute byl vytvořen tak, aby je vyřešil všechny – od překročení nákladů po regionální bloky, od přerušených toků OAuth po operace protokolů a podniková pozorovatelnost.


💸 1. „Platím za drahé předplatné, ale stále mě vyrušují limity“
Vývojáři platí 20–200 $ měsíčně za Claude Pro, Codex Pro nebo GitHub Copilot. I při placení má kvóta strop – 5 hodin používání, týdenní limity nebo limity sazby za minutu. Uprostřed relace kódování poskytovatel přestane reagovat a vývojář ztrácí tok a produktivitu.
Jak to řeší OmniRoute:

Chytrý 4-úrovňový záložní zdroj – Pokud dojde k vyčerpání kvóty předplatného, automaticky se přesměruje na klíč API → Levné → Zdarma s nulovým ručním zásahem
Sledování kvóty v reálném čase – Zobrazuje spotřebu tokenů v reálném čase s resetovaným odpočítáváním (5 hodin, denně, týdně)
– Podpora více účtů – Více účtů na poskytovatele s automatickým opakováním – když jeden dojde, přepne se na další
Vlastní komba — Přizpůsobitelné záložní řetězce se 6 strategiemi vyvažování (nejprve naplnit, opakovaně používat, P2C, náhodné, nejméně používané, nákladově optimalizované)
Codex Business Quotas — Sledování kvót Business/Tým pracovního prostoru přímo na řídicím panelu



🔌 2. "Potřebuji používat více poskytovatelů, ale každý má jiné API"
OpenAI používá jeden formát, Claude (Anthropic) jiný a Gemini ještě jiný. Pokud chce vývojář testovat modely od různých poskytovatelů nebo mezi nimi couvnout, musí překonfigurovat sady SDK, změnit koncové body, vypořádat se s nekompatibilními formáty. Vlastní poskytovatelé (FriendLI, NIM) mají nestandardní koncové body modelu.
Jak to řeší OmniRoute:

Unified Endpoint – Jediný http://localhost:20128/v1 slouží jako proxy pro všech 67+ poskytovatelů
Formátový překlad — Automatický a transparentní: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
– Reakce Sanitization – Odstraňuje nestandardní pole (x_groq, usage_breakdown, service_tier), která porušují OpenAI SDK v1.83+
Normalizace rolí – Převádí developer → system pro poskytovatele mimo OpenAI; system → user pro GLM/ERNIE
Think Tag Extraction – Extrahuje <think> bloky z modelů jako DeepSeek R1 do standardizovaných reasoning_content
Strukturovaný výstup pro Gemini — json_schema → responseMimeType/responseSchema automatický převod
– stream výchozí nastavení na false – Vyhovuje specifikaci OpenAI a zabraňuje neočekávanému SSE v sadách Python/Rust/Go SDK



🌐 3. „Můj poskytovatel umělé inteligence blokuje můj region/zemi“
Poskytovatelé jako OpenAI/Codex blokují přístup z určitých geografických oblastí. Během připojení OAuth a API se uživatelům zobrazují chyby jako unsupported_country_region_territory. To je frustrující zejména pro vývojáře z rozvojových zemí.
Jak to řeší OmniRoute:
– 3úrovňová konfigurace proxy – konfigurovatelný proxy na 3 úrovních: globální (veškerý provoz), podle poskytovatele (pouze jeden poskytovatel) a podle připojení/klíče

Barevně kódované odznaky proxy — Vizuální indikátory: 🢢 globální proxy, 🟡 proxy poskytovatele, 🔵 proxy připojení, vždy zobrazující IP
Výměna tokenů OAuth přes proxy – tok OAuth prochází také přes proxy, čímž se řeší unsupported_country_region_territory
Testy připojení přes proxy — Testy připojení používají nakonfigurovaný proxy (už žádné přímé obcházení)
Podpora SOCKS5 — Plná podpora proxy SOCKS5 pro odchozí směrování
TLS Fingerprint Spoofing – TLS otisk prstu podobný prohlížeči přes wreq-js k obejití detekce botů
🔏 CLI Fingerprint Matching – Změní pořadí záhlaví a polí těla tak, aby odpovídaly nativním binárním podpisům CLI, čímž se drasticky sníží riziko označení účtu. IP proxy serveru je zachována – získáte současně maskování IP maskování ** a** utajení



🆓 4. "Chci používat AI pro kódování, ale nemám peníze"
Ne každý může platit 20–200 $ měsíčně za předplatné AI. Studenti, vývojáři z rozvíjejících se zemí, fandové a nezávislí pracovníci potřebují přístup ke kvalitním modelům za nulové náklady.
Jak to řeší OmniRoute:

Vestavění poskytovatelé bezplatných úrovní — Nativní podpora pro 100% bezplatné poskytovatele: iFlow (5 neomezených modelů přes OAuth: kimi-k2-thinking, qwen3-coder-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 neomezené modely: qwen3-qwender-lash, qwen3-qwender-lash qwen3-coder-next, vision-model), Kiro (Claude + AWS Builder ID zdarma), Gemini CLI (180 000 tokenů/měsíc zdarma)
Ollama Cloud – modely Ollama hostované v cloudu na api.ollama.com s bezplatnou úrovní „Light use“; použijte předponu ollamacloud/<model>
Pouze bezplatná komba — Řetězec gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = 0 $/měsíc s nulovými prostoji
Volný přístup NVIDIA NIM — ~40 RPM pro vývojáře - navždy bezplatný přístup k více než 70 modelům na build.nvidia.com (přechod z kreditů na limity čisté sazby)
Cost Optimized Strategy – Strategie směrování, která automaticky vybírá nejlevnějšího dostupného poskytovatele



🔒 5. „Potřebuji chránit svou bránu AI před neoprávněným přístupem“
Při vystavení brány AI do sítě (LAN, VPS, Docker) může kdokoli s adresou spotřebovat tokeny/kvótu vývojáře. Bez ochrany jsou rozhraní API zranitelná vůči zneužití, rychlému vložení a zneužití.
Jak to řeší OmniRoute:
– Správa klíčů API – Generování, rotace a rozsah podle poskytovatele s vyhrazenou stránkou /dashboard/api-manager

Oprávnění na úrovni modelu – Omezte klíče API na konkrétní modely (openai/*, vzory zástupných znaků) pomocí přepínače Povolit vše/Omezit
– API Endpoint Protection – Vyžadovat klíč pro /v1/models a blokovat konkrétní poskytovatele v seznamu
Auth Guard + ochrana CSRF – Všechny trasy řídicího panelu chráněny middlewarem withAuth + tokeny CSRF
Rate Limiter — omezení rychlosti na IP pomocí konfigurovatelných oken
IP Filtering — Seznam povolených/blokovaných pro řízení přístupu
Prompt Injection Guard – Dezinfekce proti škodlivým vzorům výzev
Šifrování AES-256-GCM — Přihlašovací údaje jsou v klidu zašifrovány



🛑 6. „Můj poskytovatel selhal a ztratil jsem tok kódování“
Poskytovatelé umělé inteligence se mohou stát nestabilními, vracet chyby 5xx nebo narazit na dočasné limity sazeb. Pokud vývojář závisí na jediném poskytovateli, je přerušen. Bez jističů mohou opakované pokusy způsobit selhání aplikace.
Jak to řeší OmniRoute:

Jistič pro každý model — Automatické otevírání/zavírání s konfigurovatelnými prahy a ochlazením (zavřeno/otevřeno/polootevřeno), s rozsahem pro každý model, aby se zabránilo kaskádovým blokům
Exponential Backoff — Progresivní zpoždění opakování
Anti-Thundering Herd — Mutex + semaforová ochrana proti souběžným opakovaným bouřím
Combo Fallback Chains — Pokud primární poskytovatel selže, automaticky projde řetězcem bez zásahu
Combo Circuit Breaker – Automaticky deaktivuje selhávající poskytovatele v rámci kombinovaného řetězce
– Health Dashboard – Monitorování provozuschopnosti, stavy jističů, uzamčení, statistiky mezipaměti, latence p50/p95/p99



🔧 7. „Konfigurace každého nástroje umělé inteligence je únavná a opakující se“
Vývojáři používají Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Každý nástroj potřebuje jinou konfiguraci (API endpoint, klíč, model). Překonfigurování při změně poskytovatele nebo modelu je ztráta času.
Jak to řeší OmniRoute:

CLI Tools Dashboard – Vyhrazená stránka s nastavením jedním kliknutím pro Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
– GitHub Copilot Config Generator – Generuje chatLanguageModels.json pro kód VS s hromadným výběrem modelu
Průvodce přihlášením – Průvodce nastavením ve 4 krocích pro začínající uživatele
– Jeden koncový bod, všechny modely – Nakonfigurujte http://localhost:20128/v1 jednou, získáte přístup k více než 67 poskytovatelům



🔑 8. „Správa tokenů OAuth od více poskytovatelů je peklo“
Claude Code, Codex, Gemini CLI, Copilot – všechny používají OAuth 2.0 s končícími tokeny. Vývojáři se musí neustále znovu autentizovat, řešit problémy client_secret is missing, redirect_uri_mismatch a selhání na vzdálených serverech. Zvláště problematické je OAuth na LAN/VPS.
Jak to řeší OmniRoute:

Automatické obnovení tokenu – Tokeny OAuth se před vypršením platnosti obnovují na pozadí
Vestavěný OAuth 2.0 (PKCE) — Automatický tok pro Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
– Multi-Account OAuth – Více účtů na poskytovatele prostřednictvím extrakce tokenů JWT/ID
OAuth LAN/Remote Fix — Detekce privátní IP adresy pro redirect_uri + ruční režim URL pro vzdálené servery
OAuth Behind Nginx - Používá window.location.origin pro reverzní kompatibilitu proxy
– Průvodce vzdáleným OAuth – Podrobný průvodce pro přihlašovací údaje Google Cloud na VPS/Docker



📊 9. "Nevím, kolik utrácím nebo kde"
Vývojáři využívají více placených poskytovatelů, ale nemají jednotný pohled na výdaje. Každý poskytovatel má svůj vlastní panel fakturace, ale neexistuje žádné konsolidované zobrazení. Neočekávané náklady se mohou nahromadit.
Jak to řeší OmniRoute:

Cost Analytics Dashboard – Sledování nákladů na token a správa rozpočtu na poskytovatele
Rozpočtové limity na úroveň – Strop útraty na úroveň, který spouští automatickou rezervu
Konfigurace cen za model – Konfigurovatelné ceny za model
Statistika využití na klíč API — Počet požadavků a naposledy použité časové razítko na klíč
– Panel Analytics – Statistické karty, graf využití modelu, tabulka poskytovatelů s mírou úspěšnosti a latencí



🐛 10. „Nemohu diagnostikovat chyby a problémy ve voláních AI“
Když se volání nezdaří, vývojář neví, zda to byl limit sazby, vypršela platnost tokenu, nesprávný formát nebo chyba poskytovatele. Fragmentované protokoly napříč různými terminály. Bez pozorovatelnosti je ladění metodou pokus-omyl.
Jak to řeší OmniRoute:

Sjednocený panel protokolů – 4 karty: Protokoly požadavků, Protokoly proxy, Protokoly auditu, Konzole
Console Log Viewer — Prohlížeč ve stylu terminálu v reálném čase s barevně odlišenými úrovněmi, automatickým posouváním, vyhledáváním, filtrem
Protokoly SQLite Proxy — Trvalé protokoly, které vydrží restartování serveru
Translator Playground — 4 režimy ladění: Playground (překlad formátu), Tester chatu (zpáteční), Test Bench (dávka), Live Monitor (v reálném čase)
– Požadavek na telemetrii – latence p50/p95/p99 + sledování X-Request-Id
– Protokolování založené na souborech s rotací – Konzolový interceptor zaznamenává vše do protokolu JSON s rotací podle velikosti
System Info Report – npm run system-info generuje system-info.txt s vaším úplným prostředím (verze uzlu, verze OmniRoute, OS, nástroje CLI, stav Docker/PM2). Připojte jej při hlášení problémů pro okamžité třídění.



🏗️ 11. „Nasazení a údržba brány je složitá“
Instalace, konfigurace a údržba AI proxy v různých prostředích (místní, VPS, Docker, cloud) je náročná na práci. Problémy jako pevně zakódované cesty, EACCES v adresářích, konflikty portů a sestavení napříč platformami zvyšují tření.
Jak to řeší OmniRoute:

Globální instalace npm — npm install -g omniroute && omniroute — hotovo
Docker Multi-Platform – nativní AMD64 + ARM64 (Apple Silicon, AWS Graviton, Raspberry Pi)
Profily Docker Compose — base (žádné nástroje CLI) a cli (s Claude Code, Codex, OpenClaw)
Electron Desktop App – nativní aplikace pro Windows/macOS/Linux se systémovou lištou, automatickým spuštěním, offline režimem
Split-Port Mode – API a Dashboard na samostatných portech pro pokročilé scénáře (reverzní proxy, kontejnerová síť)
Cloud Sync — Konfigurace synchronizace mezi zařízeními pomocí Cloudflare Workers
DB Backups — Automatické zálohování, obnova, export a import všech nastavení



🌍 12. "Rozhraní je pouze v angličtině a můj tým nemluví anglicky"
Týmy v neanglicky mluvících zemích, zejména v Latinské Americe, Asii a Evropě, se potýkají s rozhraním pouze v angličtině. Jazykové bariéry snižují přijetí a zvyšují chyby konfigurace.
Jak to řeší OmniRoute:

Dashboard i18n — 30 jazyků — Všech 500+ kláves přeloženo včetně arabštiny, bulharštiny, dánštiny, němčiny, španělštiny, finštiny, francouzštiny, hebrejštiny, hindštiny, maďarštiny, indonéštiny, italštiny, japonštiny, korejštiny, malajštiny, holandštiny, norštiny, polštiny, portugalštiny (PT/BR), rumunštiny, ruštiny, slovenštiny, švédštiny, thajštiny, filipínštiny, vietnamštiny, angličtiny
Podpora RTL — Podpora zprava doleva pro arabštinu a hebrejštinu
Vícejazyčné README — 30 kompletních překladů dokumentace
Language Selector — Ikona zeměkoule v záhlaví pro přepínání v reálném čase



🔄 13. „Potřebuji víc než chat – potřebuji vložení, obrázky, zvuk“
AI není jen dokončení chatu. Vývojáři potřebují generovat obrázky, přepisovat zvuk, vytvářet vložení pro RAG, měnit hodnocení dokumentů a moderovat obsah. Každé API má jiný koncový bod a formát.
Jak to řeší OmniRoute:

Vložení — /v1/embeddings se 6 poskytovateli a více než 9 modely
Generování obrázků — /v1/images/generations s 10 poskytovateli a 20+ modely (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
Text-to-Video — /v1/videos/generations — ComfyUI (AnimateDiff, SVD) a SD WebUI
Text-to-Music — /v1/music/generations — ComfyUI (Stable Audio Open, MusicGen)
Audio Transscription — /v1/audio/transcriptions — Whisper + Nvidia NIM, HuggingFace, Qwen3
Text-to-Speech — /v1/audio/speech — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT, + stávající poskytovatelé
Moderování — /v1/moderations — Kontroly bezpečnosti obsahu
Změna pořadí — /v1/rerank — Změna relevance dokumentu
Responses API – plná podpora /v1/responses pro Codex



🧪 14. „Nemám způsob, jak testovat a porovnávat kvalitu různých modelů“
Vývojáři chtějí vědět, který model je pro jejich případ použití nejlepší – kód, překlad, uvažování – ale ruční porovnávání je pomalé. Neexistují žádné integrované nástroje eval.
Jak to řeší OmniRoute:

Hodnocení LLM – Testování zlaté sady s 10 předem nahranými případy zahrnujícími pozdravy, matematiku, geografii, generování kódu, soulad s JSON, překlad, markdown, bezpečnostní odmítnutí
4 strategie shody — exact, contains, regex, custom (funkce JS)
Testovací stolice pro překladatelské hřiště – Dávkové testování s více vstupy a očekávanými výstupy, porovnání mezi poskytovateli
Chat Tester – Kompletní zpáteční cesta s vykreslováním vizuální odezvy
Live Monitor — Tok všech požadavků procházejících přes proxy v reálném čase



📈 15. „Potřebuji škálovat bez ztráty výkonu“
Jak roste objem požadavků, bez ukládání stejných otázek do mezipaměti vznikají duplicitní náklady. Bez idempotence duplikát požaduje zpracování odpadu. Musí být dodrženy limity sazeb na poskytovatele.
Jak to řeší OmniRoute:

Sémantická mezipaměť – Dvouvrstvá mezipaměť (podpis + sémantická) snižuje náklady a latenci
Idempotency požadavku — 5s deduplikační okno pro identické požadavky
– Detekce limitu rychlosti – RPM na poskytovatele, minimální mezera a maximální souběžné sledování
Upravitelné limity rychlosti – Konfigurovatelné výchozí hodnoty v Nastavení → Odolnost s perzistencí
API Key Validation Cache — 3vrstvá mezipaměť pro produkční výkon
– Health Dashboard s telemetrií – latence p50/p95/p99, statistiky mezipaměti, doba provozu



🤖 16. „Chci globálně ovládat chování modelu“
Vývojáři, kteří chtějí všechny odpovědi v konkrétním jazyce, s konkrétním tónem nebo chtějí omezit tokeny uvažování. Konfigurace tohoto v každém nástroji/požadavku je nepraktická.
Jak to řeší OmniRoute:

System Prompt Injection – Globální výzva aplikovaná na všechny požadavky
Thinking Budget Validation — Řízení alokace tokenů na základě požadavku (průchozí, automatické, vlastní, adaptivní)
6 směrovacích strategií — Globální strategie, které určují způsob distribuce požadavků
– Wildcard Router – provider/* vzory dynamicky směrují k libovolnému poskytovateli
Povolit/zakázat přepínání komba — Přepínejte komba přímo z řídicího panelu
Přepnutí poskytovatele — Povolí/zakáže všechna připojení pro poskytovatele jedním kliknutím
– Blokovaní poskytovatelé – vyloučení konkrétních poskytovatelů ze seznamu /v1/models



🧰 17. "Potřebuji nástroje MCP jako prvotřídní schopnosti produktu"
Mnoho bran AI odhaluje MCP pouze jako skrytý detail implementace. Týmy potřebují viditelnou a spravovatelnou provozní vrstvu.
Jak to řeší OmniRoute:

MCP se objeví v navigačním panelu a kartě protokolu koncového bodu
Vyhrazená stránka správy MCP s procesem, nástroji, rozsahy a auditem
Vestavěný rychlý start pro omniroute --mcp a registraci klienta



🧠 18. "Potřebuji orchestraci A2A s cestami synchronizace + streamování"
Pracovní postupy agentů vyžadují jak přímé odpovědi, tak dlouhotrvající streamované spouštění s řízením životního cyklu.
Jak to řeší OmniRoute:
– Koncový bod A2A JSON-RPC (POST /a2a) s message/send a message/stream

SSE streamování s šířením koncového stavu
– Rozhraní API životního cyklu úloh pro tasks/get a tasks/cancel



🛰️ 19. „Potřebuji skutečné zdraví procesu MCP, nikoli odhadovaný stav“
Operační týmy potřebují vědět, zda je MCP skutečně naživu, nejen zda je API dosažitelné.
Jak to řeší OmniRoute:

Soubor srdečního tepu za běhu s PID, časovými razítky, transportem, počtem nástrojů a režimem rozsahu
Stavové API MCP kombinující srdeční tep + nedávnou aktivitu
Stavové karty uživatelského rozhraní pro aktuálnost procesu / provozuschopnosti / srdečního tepu



📋 20. „Potřebuji provádění auditovatelného nástroje MCP“
Když nástroje mutují konfiguraci nebo spouštějí operace operací, týmy potřebují forenzní sledovatelnost.
Jak to řeší OmniRoute:

Protokolování auditu podporované SQLite pro volání nástrojů MCP
Filtry podle nástroje, úspěchu/neúspěchu, klíče API a stránkování
Tabulka auditu řídicího panelu + statistiky koncových bodů pro automatizaci



🔐 21. „Potřebuji omezená oprávnění MCP na integraci“
Různí klienti by měli mít nejméně privilegovaný přístup ke kategoriím nástrojů.
Jak to řeší OmniRoute:

9 granulárních rozsahů MCP pro řízený přístup k nástrojům
Vynucení rozsahu a viditelnost v uživatelském rozhraní správy MCP
Bezpečná výchozí poloha pro provozní nástroje



⚙️ 22. „Potřebuji provozní kontroly bez přerozdělování“
Týmy potřebují rychlé změny běhového prostředí během incidentů nebo nákladových událostí.
Jak to řeší OmniRoute:

Aktivace kombinace přepínačů přímo z řídicího panelu MCP
Použijte profily odolnosti z předdefinovaných balíčků zásad
Resetujte stav jističe ze stejného ovládacího panelu



🔄 23. „Potřebuji živou viditelnost životního cyklu úkolu A2A a zrušení“
Bez viditelnosti životního cyklu je obtížné třídit incidenty úkolů.
Jak to řeší OmniRoute:

Seznam úkolů / filtrování podle stavu / dovedností se stránkováním
Podrobnější informace o metadatech úkolů, událostech a artefaktech
Koncový bod zrušení úlohy a akce uživatelského rozhraní s potvrzením



🌊 24. „Potřebuji aktivní metriky streamu pro načtení A2A“
Streamovací pracovní postupy vyžadují provozní přehled o souběžných a živých připojeních.
Jak to řeší OmniRoute:

Aktivní čítače toku integrované do stavu A2A
Časové razítko posledního úkolu a počty za stav
Karty palubní desky A2A pro monitorování operací v reálném čase



🪪 25. "Potřebuji standardní zjišťování agentů pro klienty"
Externí klienti a orchestrátoři potřebují strojově čitelná metadata pro integraci.
Jak to řeší OmniRoute:
– Karta agenta vystavena na /.well-known/agent.json

Schopnosti a dovednosti zobrazené v uživatelském rozhraní pro správu
A2A status API obsahuje metadata zjišťování pro automatizaci



🧭 26. "Potřebuji zjistitelnost protokolu v uživatelském rozhraní produktu"
Pokud uživatelé nemohou objevit protokolové povrchy, kvalita přijetí a podpory klesá.
Jak to řeší OmniRoute:
– Konsolidovaná stránka Koncové body s kartami pro koncové body proxy, MCP, A2A a API

Přepínání stavu inline služby (Online/Offline) pro MCP a A2A
Odkazy z přehledu na vyhrazené karty správy



🧪 27. "Potřebuji komplexní ověření protokolu se skutečnými klienty"
Falešné testy nestačí k ověření kompatibility protokolu před vydáním.
Jak to řeší OmniRoute:

Sada E2E, která spouští aplikaci a používá skutečný přenos klienta MCP SDK
Klient A2A testuje toky zjišťování, odesílání, streamování, získávání a rušení
Křížová kontrola tvrzení proti auditu MCP a API úloh A2A



📡 28. „Potřebuji jednotnou pozorovatelnost napříč všemi rozhraními“
Rozdělení pozorovatelnosti protokolem vytváří slepá místa a delší MTTR.
Jak to řeší OmniRoute:

Sjednocené dashboardy/logy/analýzy v jednom produktu
Zdraví + audit + telemetrie požadavků napříč vrstvami OpenAI, MCP a A2A
Provozní API pro stav a automatizaci



💼 29. "Potřebuji jeden runtime pro proxy + nástroje + orchestraci agenta"
Provozování mnoha samostatných služeb zvyšuje provozní náklady a způsoby selhání.
Jak to řeší OmniRoute:

Proxy, MCP server a A2A server v jednom zásobníku kompatibilní s OpenAI
Sdílená autentizace, odolnost, úložiště dat a pozorovatelnost
Konzistentní model politiky na všech interakčních plochách



🚀 30. „Potřebuji odeslat agentské pracovní postupy bez roztahování kódu lepidla“
Týmy ztrácejí rychlost při spojování více ad-hoc služeb a skriptů.
Jak to řeší OmniRoute:

Jednotná strategie koncových bodů pro klienty a agenty
Vestavěná uživatelská rozhraní pro správu protokolů a cesty ověřování kouře
Základy připravené na výrobu (zabezpečení, protokolování, odolnost, zálohování)


Vzorové příručky (integrované případy použití)
Příručka A: Maximalizujte placené předplatné + levné zálohování
Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption
Příručka B: Sada kódování s nulovými náklady
Combo: "free-forever"
  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0
Outcome: stable free coding workflow
Příručka C: 24/7 vždy zapnutý záložní řetězec
Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads
Příručka D: Operace agenta s MCP + A2A
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/endpoint (MCP and A2A tabs)
4) Toggle services via inline status controls

🆓 Začněte zdarma — nulové náklady na konfiguraci

Nastavení kódování AI během několika minut za $0/měsíc. Propojte tyto bezplatné účty a použijte vestavěnou kombinaci Free Stack.




Krok
Akce
Poskytovatelé odemčeni




1
Connect Kiro (AWS Builder ID OAuth)
Claude Sonnet 4.5, Haiku 4.5 — neomezeno


2
Připojte iFlow (Google OAuth)
kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... — bez omezení


3
Připojte Qwen (kód zařízení)
qwen3-coder-plus, qwen3-coder-flash... — bez omezení


4
Připojte Gemini CLI (Google OAuth)
gemini-3-flash, gemini-2.5-pro — 180 000/měsíc zdarma


5
/dashboard/combos → Šablona Stack zdarma (0 $)
Round-robin všechny bezplatné poskytovatele automaticky



Nasměrujte libovolné IDE/CLI na: http://localhost:20128/v1 · Klíč API: any-string · Hotovo.

Volitelné dodatečné pokrytí (také zdarma): Klíč Groq API (30 RPM zdarma), NVIDIA NIM (40 RPM zdarma, 70+ modelů), Cerebras (1 M token/den), LongCat API klíč (50 M tokenů/den!), Cloudflare Workers AI (10 000 neuronů/den, 50+ modelů).

⚡ Rychlý start
1) Nainstalujte a spusťte
npm install -g omniroute
omniroute

Uživatelé pnpm: Po instalaci spusťte pnpm approve-builds -g, abyste povolili nativní skripty sestavení vyžadované better-sqlite3 a @swc/core:
pnpm install -g omniroute
pnpm approve-builds -g   # Select all packages → approve
omniroute

Dashboard se otevře na http://localhost:20128 a základní adresa URL rozhraní API je http://localhost:20128/v1.



Příkaz
Popis




omniroute
Spustit server (PORT=20128, API a řídicí panel na stejném portu)


omniroute --port 3000
Nastavte kanonický/API port na 3000


omniroute --mcp
Spustit MCP server (stdio transport)


omniroute --no-open
Neotevírat automaticky prohlížeč


omniroute --help
Zobrazit nápovědu



Volitelný režim rozděleného portu:
PORT=20128 DASHBOARD_PORT=20129 omniroute
# API:       http://localhost:20128/v1
# Dashboard: http://localhost:20129
2) Připojte poskytovatele a vytvořte si klíč API

Otevřete Dashboard → Providers a připojte alespoň jednoho poskytovatele (OAuth nebo klíč API).
Otevřete Dashboard → Endpoints a vytvořte klíč API.
(Volitelné) Otevřete Dashboard → Combos a nastavte svůj záložní řetězec.

3) Nasměrujte svůj kódovací nástroj na OmniRoute
Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)
Pracuje s Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode a SDK kompatibilní s OpenAI.
4) Povolte a ověřte protokoly (v2.0)
MCP (pro operace řízené nástrojem):
omniroute --mcp
Poté připojte svého MCP klienta přes stdio a otestujte nástroje jako:

omniroute_get_health
omniroute_list_combos

A2A (pro pracovní postupy mezi agenty):
curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
5) Ověřte vše od začátku do konce (doporučeno)
npm run test:protocols:e2e
Tato sada ověřuje skutečné klientské toky MCP a A2A proti běžící aplikaci.
Alternativa: spustit ze zdroje
cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev

🐳 Docker
OmniRoute je k dispozici jako veřejný obrázek Dockeru na Docker Hub.
Rychlý běh:
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Se souborem prostředí:
# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Použití Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d



Obrázek
Štítek
Velikost
Popis




diegosouzapw/omniroute
latest
~250 MB
Poslední stabilní verze


diegosouzapw/omniroute
1.0.3
~250 MB
Aktuální verze




🖥️ Desktopová aplikace — offline a vždy zapnutá

🆕 NOVINKA! OmniRoute je nyní k dispozici jako nativní desktopová aplikace pro Windows, macOS a Linux.

Spusťte OmniRoute jako samostatnou desktopovou aplikaci – pro místní modely není potřeba žádný terminál, žádný prohlížeč ani internet. Aplikace založená na Electronu zahrnuje:

🖥️ Nativní okno — Vyhrazené okno aplikace s integrací na systémové liště
🔄 Auto-Start – Spusťte OmniRoute při přihlášení do systému
🔔 Nativní oznámení – Získejte upozornění na vyčerpání kvóty nebo problémy s poskytovatelem
⚡ Instalace jedním kliknutím — NSIS (Windows), DMG (macOS), AppImage (Linux)
🌐 Režim offline – Funguje plně offline s přibaleným serverem

Rychlý start
# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)
Systémová lišta
Když je minimalizován, OmniRoute žije v systémové liště s rychlými akcemi:

Otevřete palubní desku
Změňte port serveru
Ukončete aplikaci

📖 Úplná dokumentace: OMNI_TOKEN_153

💰 Přehled cen



Úroveň
Poskytovatel
Cena
Obnovení kvóty
Nejlepší pro




💳 PŘEDPLATNÉ
Claude Code (Pro)
20 $/měsíc
5h + týdně
Již přihlášeno



Codex (Plus/Pro)
20–200 USD/měsíc
5h + týdně
Uživatelé OpenAI



Gemini CLI
ZDARMA
180 tis./měsíc + 1 tis./den
Každý!



GitHub Copilot
10–19 USD/měsíc
Měsíčně
Uživatelé GitHubu


🔑 API KEY
NVIDIA NIM
ZDARMA (dev forever)
~40 RPM
70+ otevřených modelů



Cerebras
ZDARMA (1 milion toku/den)
60 000 TPM / 30 RPM
Nejrychlejší na světě



Groq
ZDARMA (30 RPM)
14,4K RPD
Ultra rychlá lama/gemma



DeepSeek V3.2
0,27 / 1,10 za 1 milion
Žádné
Nejlepší zdůvodnění cena/kvalita



xAI Grok-4 Fast
0,20 /0,50  za 1M 🆕
Žádné
Nejrychlejší + volání nástroje, ultranízké



xAI Grok-4 (standardní)
0,20 /1,50  za 1M 🆕
Žádné
Reasoning vlajková loď od xAI



Mistral
Vyzkoušení zdarma + placené
Omezená sazba
Evropská umělá inteligence



OpenRouter
Platba za použití
Žádné
100+ modelů agr.


💰 LEVNĚ
GLM-5 (přes Z.AI) 🆕
0,5 $/1 mil.
Denně 10:00
128K výstup, nejnovější vlajková loď



GLM-4.7
0,6 $/1 mil.
Denně 10:00
Záloha rozpočtu



MiniMax M2,5 🆕
Vstup 0,3 $/1 milion
5hodinové válcování
Úvahy + agentské úkoly



MiniMax M2.1
0,2 $/1 mil.
5hodinové válcování
Nejlevnější varianta



Kimi K2.5 (Moonshot API) 🆕
Platba za použití
Žádné
Přímý přístup Moonshot API



Kimi K2
9 $/měsíc byt
10 milionů tokenů/měsíc
Předvídatelné náklady


🆓 ZDARMA
iFlow
$0
Neomezené
5 modelů neomezeně



Qwen
$0
Neomezené
4 modely neomezeně



Kiro
$0
Neomezené
Claude Sonnet/Haiku (stavitel AWS)



LongCat Flash-Lite 🆕
$0 (50 milionů toku/den 🔥)
1 RPS
Největší bezplatná kvóta na Zemi



Opylování AI 🆕
$0 (není potřeba žádný klíč)
1 požadavek/15s
GPT-5, Claude, DeepSeek, Llama 4



Cloudflare Workers AI 🆕
$0 (10 000 neuronů/den)
~150 resp./den
50+ modelů, globální náskok



Scaleway AI 🆕
$0 (celkem 1 milion tokenů)
Omezená sazba
EU/GDPR, Qwen3 235B, Lama 70B




🆕 Přidané nové modely (březen 2026): Rodina Grok-4 Fast za 0,20 $/0,50 $/M (porovnávací rychlost 1143 ms – o 30 % rychlejší než Gemini 2.5 Flash), GLM-5 přes Z.AI s výstupem 128K, aktualizovaná cena MiniMax M2.5 V5, Kimishot K2 API přímo.

💡 Combo Stack 0 $ — Kompletní bezplatné nastavení:
# 🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever
Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free API key
Cloudflare AI (cf/)    → Llama 70B, Gemma 3, Mistral — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma ultra-fast — 14.4K req/day
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day
Nulové náklady. Nikdy nepřestane kódovat. Nakonfigurujte si to jako jednu kombinaci OmniRoute a všechna nouzová řešení se stanou automaticky – žádné ruční přepínání.


🆓 Modely zdarma — to, co skutečně získáte

Všechny níže uvedené modely jsou 100% zdarma bez nutnosti použití kreditní karty. OmniRoute mezi nimi automaticky přesměrovává, když vyčerpá jedna kvóta – zkombinujte je všechny a získáte nerozbitnou kombinaci 0 $.

🔵 CLAUDE MODELS (přes Kiro — AWS Builder ID)



Model
Předpona
Limit
Limit sazby




claude-sonnet-4.5
kr/
Neomezeno
Žádný hlášený denní limit


claude-haiku-4.5
kr/
Neomezeno
Žádný hlášený denní limit


claude-opus-4.6
kr/
Neomezeno
Nejnovější Opus přes Kiro



🢢 MODELY IFLOW (bezplatný protokol OAuth – žádná kreditní karta)



Model
Předpona
Limit
Limit sazby




kimi-k2-thinking
if/
Neomezeno
Žádný nahlášený strop


qwen3-coder-plus
if/
Neomezeno
Žádný nahlášený strop


deepseek-r1
if/
Neomezeno
Žádný nahlášený strop


minimax-m2.1
if/
Neomezeno
Žádný nahlášený strop


kimi-k2
if/
Neomezeno
Žádný nahlášený strop



🡡 QWEN MODELS (Auth Code Auth)



Model
Předpona
Limit
Limit sazby




qwen3-coder-plus
qw/
Neomezeno
Žádný nahlášený strop


qwen3-coder-flash
qw/
Neomezeno
Žádný nahlášený strop


qwen3-coder-next
qw/
Neomezeno
Žádný nahlášený strop


vision-model
qw/
Neomezeno
Multimodální (obrázky)



🟣 GEMINI CLI (Google OAuth)



Model
Předpona
Limit
Limit sazby




gemini-3-flash-preview
gc/
180 tis./měsíc + 1 tis./den
Měsíční reset


gemini-2.5-pro
gc/
180 tis./měsíc (sdílený bazén)
Vysoká kvalita



⚫ NVIDIA NIM (bezplatný klíč API — build.nvidia.com)



Úroveň
Denní limit
Limit sazby
Poznámky




Zdarma (Dev)
Žádný token cap
~40 RPM
70+ modelů; přechod na limity čisté sazby v polovině roku 2025



Oblíbené bezplatné modely: moonshotai/kimi-k2.5 (Kimi K2.5), z-ai/glm4.7 (GLM 4.7), deepseek-ai/deepseek-v3.2 (DeepSeek V3.2), nvidia/llama-3.3-70b-instruct_, _6_18
⚪ CEREBRAS (Free API Key — inference.cerebras.ai)



Úroveň
Denní limit
Limit sazby
Poznámky




Zdarma
1 mil. tokenů/den
60 000 TPM / 30 RPM
Světově nejrychlejší odvození LLM; resetuje denně



Dostupné zdarma: llama-3.3-70b, llama-3.1-8b, deepseek-r1-distill-llama-70b
🔴 GROQ (Free API Key — console.groq.com)



Úroveň
Denní limit
Limit sazby
Poznámky




Zdarma
14,4K RPD
30 ot./min na model
Žádná kreditní karta; 429 na limit, neúčtuje se



Dostupné zdarma: llama-3.3-70b-versatile, gemma2-9b-it, mixtral-8x7b, whisper-large-v3
🔴 LONGCAT AI (bezplatný klíč API — longcat.chat) 🆕



Model
Předpona
Denní kvóta zdarma
Poznámky




LongCat-Flash-Lite
lc/
50 milionů žetonů 💥
Největší bezplatná kvóta všech dob


LongCat-Flash-Chat
lc/
500 000 tokenů
Víceotáčkový chat


LongCat-Flash-Thinking
lc/
500 000 tokenů
Zdůvodnění / CoT


LongCat-Flash-Thinking-2601
lc/
500 000 tokenů
Verze z ledna 2026


LongCat-Flash-Omni-2603
lc/
500 000 tokenů
Multimodální




100% zdarma ve veřejné beta verzi. Zaregistrujte se na longcat.chat pomocí e-mailu nebo telefonu. Resetuje se denně v 00:00 UTC.

🢢 POLLINATIONS AI (nevyžaduje se žádný klíč API) 🆕



Model
Předpona
Limit sazby
Poskytovatel za




openai
pol/
1 požadavek/15s
GPT-5


claude
pol/
1 požadavek/15s
Antropický Claude


gemini
pol/
1 požadavek/15s
Google Gemini


deepseek
pol/
1 požadavek/15s
DeepSeek V3


llama
pol/
1 požadavek/15s
Meta Llama 4 Scout


mistral
pol/
1 požadavek/15s
Mistral AI




✨ Nulové tření: Žádná registrace, žádný klíč API. Přidejte poskytovatele Pollinations s prázdným polem klíče a funguje to okamžitě.

🟠 CLOUDFLARE WORKERS AI (Free API Key — cloudflare.com) 🆕



Úroveň
Denní neurony
Ekvivalentní použití
Poznámky




Zdarma
10 000
~150 LLM resp / 500s audio / 15K vložení
Global edge, 50+ modelů



Oblíbené bezplatné modely: @cf/meta/llama-3.3-70b-instruct, @cf/google/gemma-3-12b-it, @cf/openai/whisper-large-v3-turbo (zvuk zdarma!), @cf/qwen/qwen2.5-coder-15b-instruct

Vyžaduje API Token + ID účtu z dash.cloudflare.com. Uložte ID účtu v nastavení poskytovatele.

🟣 SCALEWAY AI (1 milion bezplatných tokenů — scaleway.com) 🆕



Úroveň
Kvóta zdarma
Umístění
Poznámky




Zdarma
1 milion tokenů
🇫🇷 Paříž, EU
V rámci limitů není potřeba žádná kreditní karta



Dostupné zdarma: qwen3-235b-a22b-instruct-2507 (Qwen3 235B!), llama-3.1-70b-instruct, mistral-small-3.2-24b-instruct-2506, deepseek-v3-0324

V souladu s EU/GDPR. Získejte API klíč na console.scaleway.com.


💡 The Ultimate Free Stack (11 poskytovatelů, 0 $ navždy):
Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder models UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free
Cloudflare AI (cf/)    → 50+ models — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma — 14.4K req/day ultra-fast
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day

🎙️ Kombinace bezplatných přepisů

Přepis jakéhokoli zvuku/videa za **0** — Deepgram vede s 200  zdarma, AssemblyAI 50 $ nouzové zálohy, Groq Whisper jako neomezené nouzové zálohování.




Poskytovatel
Kredity zdarma
Nejlepší modelka
Limit sazby




🢢 Deepgram
200 $ zdarma (registrace)
nova-3 — nejvyšší přesnost, více než 30 jazyků
Žádný limit RPM na bezplatné kredity


🔵 SestaveníAI
50 $ zdarma (registrace)
universal-3-pro — kapitoly, sentiment, PII
Žádný limit RPM na bezplatné kredity


🔴 Groq
Navždy zdarma
whisper-large-v3 — OpenAI Whisper
30 RPM (rychlost omezená)



Doporučená kombinace v /dashboard/combos:
Name: free-transcription
Strategy: Priority
Nodes:
  [1] deepgram/nova-3          → uses $200 free first
  [2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
  [3] groq/whisper-large-v3    → free forever, emergency fallback
Poté na /dashboard/media → karta Přepis: nahrajte jakýkoli zvukový nebo video soubor → vyberte svůj kombinovaný koncový bod → získejte přepis v podporovaných formátech.
💡 Klíčové vlastnosti
OmniRoute v2.0 je postaven jako operační platforma, nikoli pouze jako přenosová proxy.
🆕 Novinka — Vylepšení inspirovaná ClawRouterem (březen 2026)



Funkce
Co to dělá




⚡ Grok-4 Fast Family
xAI modely za 0,20 $/0,50 $/M – srovnávací 1143 ms (o 30 % rychlejší než Gemini 2.5 Flash)


🧠 GLM-5 přes Z.AI
128 000 výstupní kontext, 0,5 $/1 milion – nejnovější vlajková loď z rodiny GLM


🔮 MiniMax M2.5
Úvahy + agentní úkoly za 0,30 $/1 milion – významný upgrade z M2,1


🎯 toolCalling Flag na model
Pro model toolCalling: true/false v registru – AutoCombo přeskočí modely, které nepodporují nástroje


🌍 Multilingual Intent Detection
Klíčová slova PT/ZH/ES/AR v hodnocení AutoCombo – lepší výběr modelu pro neanglický obsah


📊 Zástupy založené na benchmarku
Skutečná latence p95 z kombinovaného bodování zdrojů živých požadavků – AutoCombo se učí ze skutečných dat


🔁 Požádat o deduplikaci
Okno pro odstranění duplicitního obsahu založené na hašování obsahu – bezpečné pro více agentů, zabraňuje duplicitním poplatkům


🔌 Strategie připojitelného směrovače
Rozšiřitelné rozhraní RouterStrategy – přidat vlastní logiku směrování jako zásuvné moduly



🚀 Předchozí v2.0.9+ — Hřiště, CLI Fingerprints & ACP



Funkce
Co to dělá




🎮 Modelové hřiště
Stránka řídicího panelu pro přímé testování jakéhokoli modelu — voliče poskytovatele/modelu/koncového bodu, editor Monaco, streamování, přerušení, načasování


🔏 CLI Fingerprint Matching
Uspořádání záhlaví/těla podle poskytovatele tak, aby odpovídalo nativním signaturám CLI – přepněte podle poskytovatele v Nastavení > Zabezpečení. Vaše IP adresa proxy je zachována


🤝 Podpora ACP (Protokol klienta agenta)
Zjišťování agentů CLI (Codex, Claude, Goose, Gemini CLI, OpenClaw + 9 dalších), zpracovatel procesů, koncový bod /api/acp/agents


🤖 Hlavní panel agentů AKT
Debug › Stránka Agenti — mřížka 14 agentů se stavem instalace, verzí, uživatelským formulářem agenta pro libovolný nástroj CLI. Uživatelé OpenCode získají tlačítko „Stáhnout opencode.json“, které automaticky vygeneruje konfiguraci připravenou k použití se všemi dostupnými modely.


🔧 Vlastní model apiFormat Směrování
Vlastní modely s apiFormat: "responses" nyní správně směrují do překladače Responses API


🏢 Codex Workspace Isolation
Více pracovních prostorů Codex na e-mail — OAuth správně odděluje připojení podle ID pracovního prostoru


🔄 Elektronová automatická aktualizace
Desktopová aplikace kontroluje aktualizace + automatická instalace při restartu



🤖 Operace agentů a protokolů (v2.0)



Funkce
Co to dělá




🔧 MCP Server (16 nástrojů)
Nástroje IDE/agenta prostřednictvím 3 přenosů: stdio, SSE (/api/mcp/sse), Streamable HTTP (/api/mcp/stream)


🤝 Server A2A (JSON-RPC + SSE)
Provádění úlohy agent-agent se synchronizací a streamováním


🧭 Stránka konsolidovaných koncových bodů
Stránka správy s kartami s kartami Endpoint Proxy, MCP, A2A a API Endpoints


🎚️ Přepínače aktivace/deaktivace služby
Spínače ON/OFF pro MCP a A2A s trvalým nastavením (výchozí: OFF)


🛰️ MCP Runtime Heartbeat
Skutečný stav procesu (pid, doba provozu, doba srdečního tepu, transport, režim rozsahu)


📋 MCP Audit Trail
Filtrovatelné protokoly auditu s úspěchem/neúspěchem a přiřazením klíče


🔐 Vymáhání rozsahu MCP
9 podrobných oprávnění rozsahu pro řízený přístup k nástroji


📡 A2A Task Lifecycle Management
Vypsat/filtrovat úlohy, zkontrolovat události/artefakty, zrušit běžící úlohy


📋 Zjištění karty agenta
/.well-known/agent.json pro automatické zjišťování klienta


🧪 Protokol E2E Test Harness
Skutečné toky MCP SDK + A2A klient v test:protocols:e2e


⚙️ Provozní ovládací prvky
Kombinace přepínačů, použití profilů odolnosti, resetování jističů z jedné ovládací plochy



🧠 Směrování a inteligence



Funkce
Co to dělá




🎯 Chytrý 4úrovňový záložní zdroj
Automatická trasa: Předplatné → Klíč API → Levné → Zdarma


📊 Sledování kvót v reálném čase
Živý počet tokenů + reset odpočítávání na poskytovatele


🔄 Formátový překlad
OpenAI ↔ Claude ↔ Gemini ↔ Odpovědi s převody bezpečnými pro schéma


👥 Podpora více účtů
Více účtů na poskytovatele s inteligentním výběrem


🔄 Automatické obnovení tokenu
Tokeny OAuth se automaticky obnovují s opakováním


🎨 Vlastní kombinace
6 vyvažovacích strategií + řízení záložního řetězce


🌐 Wildcard Router
provider/* dynamické směrování


🧠 Přemýšlení o kontrolách rozpočtu
Limity průchozího, automatického, vlastního a adaptivního uvažování


🔀 Aliasy modelů
Vestavěný + vlastní model aliasing a bezpečnost migrace


⚡ Degradace pozadí
Směrujte úlohy s nízkou prioritou na pozadí na levnější modely


🧪 Inteligentní směrování s ohledem na úkoly
Automatický výběr modelu podle typu obsahu (kódování/vize/analýza/souhrn)


💬 System Prompt Injection
Globální ovládací prvky chování používané konzistentně


📄 Kompatibilita rozhraní Responses API
Plná podpora /v1/responses pro Codex a pokročilé agentní pracovní postupy



🎵 Multimodální API



Funkce
Co to dělá




🖼️ Generování obrázků
/v1/images/generations s cloudem a místními backendy


📐 Vložení
/v1/embeddings pro vyhledávací a RAG potrubí


🎤 Přepis zvuku
/v1/audio/transcriptions — 7 poskytovatelů (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), automatická detekce jazyka, podpora MP4/MP3/WAV


🔊 Převod textu na řeč
/v1/audio/speech — 10 poskytovatelů (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) se správnými chybovými zprávami


🎬 Generace videa
/v1/videos/generations (pracovní postupy ComfyUI + SD WebUI)


🎵 Music Generation
/v1/music/generations (pracovní postupy ComfyUI)


🛡️ Moderování
/v1/moderations bezpečnostní kontroly


🔀 Reranking
/v1/rerank pro hodnocení relevance


🔍 Vyhledávání na webu 🆕
/v1/search — 5 poskytovatelů (Serper, Brave, Perplexity, Exa, Tavily), 6 500+ zdarma/měsíc, auto-failover, cache



🛡️ Odolnost, bezpečnost a správa



Funkce
Co to dělá




🔌 Jističe
Vypnutí/obnovení pro každý model s ovládáním prahu


🎯 modely s důrazem na koncové body
Vlastní modely deklarují podporované koncové body + formát API


🛡️ Stádo proti hromům
Mutex + semaforové ochrany při opakování/rychlosti událostí


🧠 Sémantická + mezipaměť podpisů
Snížení nákladů/latence se dvěma vrstvami mezipaměti


⚡ Žádost o idempotenci
Duplicitní ochranné okno


🔒 TLS Fingerprint Spoofing
Otisk TLS jako v prohlížeči — snižuje detekci robotů a nahlašování účtu


🔏 CLI Fingerprint Matching
Odpovídá nativním podpisům požadavku CLI — snižuje riziko zákazu při zachování proxy IP


🌐 Filtrování IP
Kontrola seznamu povolených/blokovaných pro vystavená nasazení


📊 Upravitelné limity sazeb
Konfigurovatelné globální limity/limity na úrovni poskytovatele s perzistencí


🔑 Správa klíčů API + rozsah
Bezpečné vydávání/otočení klíčů a ovládání modelu/poskytovatele


🛡️ Chráněno /models
Volitelné ověřování a skrytí poskytovatele pro katalog modelů



📊 Pozorovatelnost a analytika



Funkce
Co to dělá




📝 Požadavek + protokolování proxy
Úplný požadavek/odpověď a protokolování proxy


📉 Streamed Detailed Logs 🆕
Reconstructs SSE payload streams cleanly into the UI


📋 Sjednocený panel protokolů
Požadavek, proxy, audit a zobrazení konzoly na jedné stránce


🔍 Požádejte o telemetrii
p50/p95/p99 latence a trasování požadavků


🏥 Health Dashboard
Doba provozuschopnosti, stavy jističe, uzamčení, statistiky mezipaměti


💰 Sledování nákladů
Kontroly rozpočtu a viditelnost cen podle modelu


📈 Analytické vizualizace
Statistiky využití modelu/poskytovatele a zobrazení trendů


🧪 Rámec hodnocení
Testování zlaté sady s konfigurovatelnými strategiemi shody



☁️ Nasazení a platforma



Funkce
Co to dělá




🌐 Nasadit kdekoli
Localhost, VPS, Docker, cloudová prostředí


💾 Cloud Sync
Synchronizace konfigurace přes cloud worker


🔄 Zálohování/Obnova
Export/import a toky obnovy po havárii


🧙 Průvodce onboardingem
První spuštění průvodce nastavením


🔧 CLI Tools Dashboard
Nastavení jedním kliknutím pro oblíbené kódovací nástroje


🎮 Modelové hřiště
Otestujte libovolného poskytovatele/model/koncový bod z řídicího panelu


🔏 CLI Fingerprint Toggle
Shoda otisků prstů jednotlivých poskytovatelů v Nastavení > Zabezpečení


🌐 i18n (30 jazyků)
Plná podpora řídicího panelu + docs s pokrytím RTL


🧹 Vymazat všechny modely
Vymazání seznamu modelů jedním kliknutím v detailech poskytovatele


👁️ Sidebar Controls 🆕
Hide components and integrations from Appearance Settings


📋 Šablony vydání
Standardizované šablony GitHub pro chyby a funkce


📂 Custom Data Directory
DATA_DIR přepsání umístění úložiště



Funkce Deep Dive
Chytrá záloha s praktickou kontrolou nákladů
Combo: "my-coding-stack"
  1. cc/claude-opus-4-6
  2. nvidia/llama-3.3-70b
  3. glm/glm-4.7
  4. if/kimi-k2-thinking
Když kvóta, rychlost nebo stav selžou, OmniRoute automaticky přejde na dalšího kandidáta bez ručního přepínání.
Správa protokolu, která je viditelná a ovladatelná

MCP + A2A jsou zjistitelné v uživatelském rozhraní a dokumentech (nejsou skryté)
– Rozhraní API stavu protokolu zpřístupňují živá provozní data (/api/mcp/*, /api/a2a/*)
Panely obsahují akce pro operace 2. dne (přepínání kombinací, resetování jističe, zrušení úkolu)

Pracovní postup překladatele + ověřování
Oblast překladatele zahrnuje:

Hřiště: Vyžádejte si kontroly transformace
Chat Tester: kompletní zpáteční cesta na žádost/odpověď
Testovací stolice: více případů v jednom běhu
Live Monitor: zobrazení dopravy v reálném čase

Plus ověření protokolu se skutečnými klienty prostřednictvím npm run test:protocols:e2e.

📖 MCP Server README — Reference nástrojů, konfigurace IDE a příklady klientů
📖 A2A Server README — Dovednosti, metody JSON-RPC, streamování a životní cyklus úkolů

🧪 Hodnocení (Evals)
OmniRoute obsahuje vestavěný hodnotící rámec pro testování kvality odezvy LLM oproti zlaté sadě. Přistupte k němu přes Analytics → Evals na hlavním panelu.
Vestavěná zlatá sada
Předinstalovaná sada „OmniRoute Golden Set“ obsahuje testovací případy pro:

Pozdravy, matematika, zeměpis, generování kódu
Kompatibilita formátu JSON, překlad, generování markdown
Bezpečnostní odmítnutí (škodlivý obsah), počítání, booleovská logika

Strategie hodnocení



Strategie
Popis
Příklad




exact
Výstup se musí přesně shodovat
"4"


contains
Výstup musí obsahovat podřetězec (nerozlišují se malá a velká písmena)
"Paris"


regex
Výstup musí odpovídat vzoru regulárního výrazu
"1.*2.*3"


custom
Vlastní funkce JS vrací true/false
(output) => output.length > 10




📖 Průvodce nastavením
Nastavení protokolu (MCP + A2A)

🧩 Nastavení MCP (Model Context Protocol)
Spusťte přenos MCP v režimu stdio:
omniroute --mcp
Doporučený postup ověření:

Připojte svého MCP klienta přes stdio.
Spusťte omniroute_get_health.
Spusťte omniroute_list_combos.
Otevřete /dashboard/mcp a potvrďte tep, aktivitu a audit.

Užitečná rozhraní API pro automatizaci:

GET /api/mcp/status
GET /api/mcp/tools
GET /api/mcp/audit
GET /api/mcp/audit/stats



🤝 Nastavení A2A (Agent2Agent)
Objevte agenta:
curl http://localhost:20128/.well-known/agent.json
Pošlete úkol:
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'
Správa životního cyklu:

GET /api/a2a/status
GET /api/a2a/tasks
GET /api/a2a/tasks/:id
POST /api/a2a/tasks/:id/cancel

Provozní uživatelské rozhraní:

/dashboard/a2a pro pozorování úkolu/stavu/streamu a kouřové akce



🧪 End-to-end ověření protokolu
Ověřte oba protokoly se skutečnými klienty:
npm run test:protocols:e2e
Tím se ověřuje:

Připojení/seznam/volání klienta MCP SDK
A2A objev/odeslat/streamovat/získat/zrušit
Křížová kontrola dat v MCP auditu a API pro správu úloh A2A



💳 Poskytovatelé předplatného
Claude Code (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001
Tip pro profesionály: Používejte Opus pro složité úkoly, Sonnet pro rychlost. OmniRoute sleduje kvótu na model!
OpenAI Codex (Plus/Pro)
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max
Správa limitu účtu Codex (5 hodin + týdně)
Každý účet Codexu má nyní přepínače zásad v Dashboard -> Providers:

5h (ZAP/VYP): vynutit zásadu prahu 5hodinového okna.
Weekly (ZAP/VYP): vynutit zásadu týdenního prahu okna.
Prahové chování: když povolené okno dosáhne využití >=90 %, daný účet je přeskočen.
Rotační chování: OmniRoute automaticky směruje na další způsobilý účet Codex.
Resetovat chování: když poskytovatel resetAt uplyne čas, účet se automaticky znovu stane způsobilým.

Scénáře:

5h ON + Weekly ON: účet je přeskočen, když kterékoli okno dosáhne prahové hodnoty.
5h OFF + Weekly ON: účet může zablokovat pouze týdenní používání.
5h ON + Weekly OFF: pouze 5hodinové používání může zablokovat účet.
resetAt prošlo: účet automaticky znovu zadá rotaci (žádné ruční opětovné povolení).

Gemini CLI (ZDARMA 180 000/měsíc!)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro
Nejlepší hodnota: Obrovská bezplatná úroveň! Použijte to před placenými úrovněmi.
GitHub Copilot
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro


🔑 Klíčoví poskytovatelé API
NVIDIA NIM (BEZPLATNÝ přístup pro vývojáře — 70+ modelů)

Zaregistrujte se: build.nvidia.com
Získejte bezplatný klíč API (včetně 1000 kreditů pro odvození)
Ovládací panel → Přidat poskytovatele → NVIDIA NIM:

Klíč API: nvapi-your-key



Modely: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct a 50+ dalších
Tip pro profesionály: API kompatibilní s OpenAI – bezproblémově funguje s překladem formátu OmniRoute!
DeepSeek

Zaregistrujte se: platform.deepseek.com
Získejte API klíč
Ovládací panel → Přidat poskytovatele → DeepSeek

Modely: deepseek/deepseek-chat, deepseek/deepseek-coder
Groq (dostupná bezplatná úroveň!)

Zaregistrujte se: console.groq.com
Získejte klíč API (včetně bezplatné úrovně)
Ovládací panel → Přidat poskytovatele → Groq

Modely: groq/llama-3.3-70b, groq/mixtral-8x7b
Tip pro profesionály: Ultra rychlé vyvozování – nejlepší pro kódování v reálném čase!
OpenRouter (100+ modelů)

Zaregistrujte se: openrouter.ai
Získejte API klíč
Ovládací panel → Přidat poskytovatele → OpenRouter

Modely: Získejte přístup k více než 100 modelům od všech hlavních poskytovatelů prostřednictvím jediného klíče API.


💰 Levní poskytovatelé (záložní)
GLM-4,7 (denní reset, 0,6 $/1 milion)

Zaregistrujte se: Zhipu AI
Získejte API klíč z Coding Plan
Ovládací panel → Přidat klíč API:
– Poskytovatel: glm

Klíč API: your-key



Použití: glm/glm-4.7
Tip pro profesionály: Kódovací plán nabízí 3× kvótu za 1/7 cenu! Resetovat denně v 10:00.
MiniMax M2.1 (5h reset, $0.20/1M)

Zaregistrujte se: MiniMax
Získejte API klíč
Ovládací panel → Přidat klíč API

Použití: minimax/MiniMax-M2.1
Tip pro profesionály: Nejlevnější možnost pro dlouhý kontext (1 milion tokenů)!
Kimi K2 (9 $ měsíčně byt)

Přihlásit se k odběru: Moonshot AI
Získejte API klíč
Ovládací panel → Přidat klíč API

Použití: kimi/kimi-latest
Tip pro profesionály: Pevná cena 9 měsíčně za 10 milionů tokenů = 0,90 / 1 milion efektivních nákladů!


🆓 ZDARMA poskytovatelé (nouzová záloha)
iFlow (5 ZDARMA modelů přes OAuth)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1
Qwen (4 ZDARMA modely prostřednictvím kódu zařízení)
Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash
Kiro (Claude FREE)
Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5


🎨 Vytvořit komba
Příklad 1: Maximalizujte předplatné → Levné zálohování
Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding
Příklad 2: Pouze zdarma (nulové náklady)
Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!


🔧 Integrace rozhraní CLI
IDE kurzoru
Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6
Claudeův kód
Použijte stránku CLI Tools na řídicím panelu pro konfiguraci jedním kliknutím nebo upravte ~/.claude/settings.json ručně.
Codex CLI
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"
OpenClaw
Možnost 1 – Hlavní panel (doporučeno):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Možnost 2 — Ručně: Upravit ~/.openclaw/openclaw.json:
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Poznámka: OpenClaw funguje pouze s místní OmniRoute. Použijte 127.0.0.1 místo localhost, abyste se vyhnuli problémům s rozlišením IPv6.

Cline / Pokračovat / RooCode
Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking
OpenCode
Krok 1: Přidejte OmniRoute jako vlastního poskytovatele:
opencode
/connect
# Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key
Krok 2: Vytvořte/upravte opencode.json v kořenovém adresáři projektu:
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "omniroute": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OmniRoute",
      "options": {
        "baseURL": "http://localhost:20128/v1"
      },
      "models": {
        "cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
        "gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
        "if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
      }
    }
  }
}
Krok 3: Vyberte model v OpenCode:
/models
# Select any OmniRoute model from the list

Tip: Přidejte jakýkoli model dostupný ve vašem koncovém bodu OmniRoute /v1/models do sekce models. Použijte formát provider/model-id z řídicího panelu OmniRoute.



🐛 Odstraňování problémů

Kliknutím rozbalíte průvodce odstraňováním problémů
"Jazykový model neposkytoval zprávy"

Kvóta poskytovatele je vyčerpána → Zkontrolujte sledování kvót na řídicím panelu
Řešení: Použijte nouzovou kombinaci nebo přejděte na levnější úroveň

Omezení sazby

Vyčerpaná kvóta předplatného → Záložní režim GLM/MiniMax
Přidat kombinaci: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

Platnost tokenu OAuth vypršela

Automaticky obnoveno OmniRoute
Pokud problémy přetrvávají: Řídicí panel → Poskytovatel → Znovu připojit

Vysoké náklady

Zkontrolujte statistiky využití v Dashboard → Náklady
Přepněte primární model na GLM/MiniMax
Používejte bezplatnou vrstvu (Gemini CLI, iFlow) pro nekritické úkoly

Porty řídicího panelu/API jsou chybné

PORT je kanonický základní port (a port API ve výchozím nastavení)
API_PORT přepíše pouze posluchač API kompatibilní s OpenAI
DASHBOARD_PORT přepíše pouze řídicí panel/posluchač Next.js
– Nastavte NEXT_PUBLIC_BASE_URL na svůj řídicí panel/veřejnou adresu URL (pro zpětná volání OAuth)

Chyby synchronizace cloudu

Ověřte BASE_URL bodů na vaši spuštěnou instanci
Ověřte CLOUD_URL bodů k očekávanému koncovému bodu cloudu
Udržujte hodnoty NEXT_PUBLIC_* zarovnané s hodnotami na straně serveru

První přihlášení nefunguje

Zkontrolujte INITIAL_PASSWORD v .env
– Pokud není nastaveno, záložní heslo je 123456

Žádné protokoly požadavků

Nastavit ENABLE_REQUEST_LOGS=true v .env

Test připojení ukazuje „Neplatné“ pro poskytovatele kompatibilní s OpenAI
– Mnoho poskytovatelů nevystavuje koncový bod /models

OmniRoute v1.0.6+ zahrnuje nouzové ověření prostřednictvím dokončení chatu
– Zajistěte, aby základní adresa URL obsahovala příponu /v1

🔐 OAuth na vzdáleném serveru



⚠️ Důležité pro uživatele používající OmniRoute na VPS, Dockeru nebo jakémkoli vzdáleném serveru

Proč selže Antigravity / Gemini CLI OAuth na vzdálených serverech?
Poskytovatelé Antigravity a Gemini CLI používají Google OAuth 2.0. Google vyžaduje, aby redirect_uri v toku OAuth přesně odpovídal jednomu z předem registrovaných URI v Google Cloud Console aplikace.
Přihlašovací údaje OAuth dodávané v OmniRoute jsou registrovány pouze pro localhost. Když přistupujete k OmniRoute na vzdáleném serveru (např. https://omniroute.myserver.com), Google odmítne ověření pomocí:
Error 400: redirect_uri_mismatch
Řešení: Nakonfigurujte si vlastní přihlašovací údaje OAuth
Ve službě Google Cloud Console musíte vytvořit OAuth 2.0 Client ID s identifikátorem URI vašeho serveru.
Krok za krokem
1. Otevřít Google Cloud Console
Přejít na: https://console.cloud.google.com/apis/credentials
2. Vytvořit nové ID klienta OAuth 2.0
– Klikněte na "+ Vytvořit přihlašovací údaje" → "ID klienta OAuth"

Typ aplikace: "Webová aplikace"
– Jméno: cokoliv se vám líbí (např. OmniRoute Remote)

3. Přidat identifikátory URI autorizovaného přesměrování
Do pole "URI autorizovaného přesměrování" přidejte:
https://your-server.com/callback

Nahraďte your-server.com doménou nebo IP vašeho serveru (v případě potřeby uveďte port, např. http://45.33.32.156:20128/callback).

4. Uložte a zkopírujte přihlašovací údaje
Po vytvoření Google zobrazí Client ID a Client Secret.
5. Nastavit proměnné prostředí
Ve vašem .env (nebo proměnných prostředí Docker):
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

# For Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
6. Restartujte OmniRoute
# npm:
npm run dev

# Docker:
docker restart omniroute
7. Zkuste se připojit znovu
Ovládací panel → Poskytovatelé → Antigravitace (nebo Gemini CLI) → OAuth
Google nyní správně přesměruje na https://your-server.com/callback.

Dočasné řešení (bez vlastních přihlašovacích údajů)
Pokud si nyní nechcete nastavovat vlastní přihlašovací údaje, můžete stále použít ruční postup URL:

OmniRoute otevře autorizační URL Google
Po autorizaci se Google pokusí přesměrovat na localhost (který selže na vzdáleném serveru)
Zkopírujte celou adresu URL z adresního řádku prohlížeče (i když se stránka nenačte)
Vložte tuto adresu URL do pole zobrazeného v modálu připojení OmniRoute
Klikněte na "Připojit"


Funguje to, protože autorizační kód v adrese URL je platný bez ohledu na to, zda se stránka přesměrování načetla.



🇧🇷 Versão em Português
Od OAuth do Antigravity / Gemini CLI falha em servidores remotos?
Osvedčuje Antigravity a Gemini CLI používáme Google OAuth 2.0 pro autenticitu. O Google exige que a redirect_uri usada no fluxo OAuth seja exatamente uma das URIs pre-cadastradas no Google Cloud Console to use.
Jako credenciais OAuth embutidas no OmniRoute estão cadastradas apenas para localhost. Quando você acessa o OmniRoute em um servidor remote (ex: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:
Error 400: redirect_uri_mismatch
Řešení: Nakonfigurujte proprias pověření OAuth
Você precisa criar um OAuth 2.0 Client ID no Google Cloud Console com a URI do seu server.
Passo a passo
1. Přístup ke službě Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Crie um novo OAuth 2.0 Client ID

Klikněte na "+ Vytvořit přihlašovací údaje" → "ID klienta OAuth"
Tipo de aplicativo: "Webová aplikace"
– Nome: escolha qualquer nome (např.: OmniRoute Remote)

3. Adicione jako Authorized Redirect URI
Žádné pole "URI autorizovaného přesměrování", adicione:
https://seu-servidor.com/callback

Substitua seu-servidor.com pelo domínio ou IP do seu servidor (inclua a porta se necessário, ex: http://45.33.32.156:20128/callback).

4. Uložit a zkopírovat jako credenciais
Após criar, o Google mostrará o Client ID e o Client Secret.
5. Konfigurovat jako variáveis de ambiente
No seu .env (ou nas variáveis de ambiente do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
6. Reinicie nebo OmniRoute
# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute
7. Tente conectar novamente
Dashboard → Poskytovatelé → Antigravitace (nebo Gemini CLI) → OAuth
Agora nebo Google redirecionará corretamente para https://seu-servidor.com/callback a autenticação funcionará.

Temporário řešení (sem configurar credenciais próprias)
Zjistěte, jaké jsou údaje o vaší kreditní kartě, a je možné, že použijete fluxo příručku URL:

O OmniRoute abrirá a URL autorização Google
Após você autorizar, o Google tentará redirecionar para localhost (que falha no servidor remoto)
Zkopírujte úplnou adresu URL da barra de endereço do seu browser (mesmo que a pagina não carregue)
Cole essa URL no campo que aparece no modal de conexão do OmniRoute
Klikněte na "Připojit"


Toto řešení funguje pomocí autorizačního kódu na URL a nezávislého přesměrování.




🛠️ Tech Stack

Kliknutím rozbalíte podrobnosti o technickém zásobníku

Runtime: Node.js 18–22 LTS (⚠️ Node.js 24+ není podporován — better-sqlite3 nativní binární soubory jsou nekompatibilní)
Jazyk: TypeScript 5.9 — 100% TypeScript napříč src/ a open-sse/ (nula any v základních modulech od verze 2.0)
Framework: Next.js 16 + React 19 + Tailwind CSS 4
Databáze: LowDB (JSON) + SQLite (stav domény + protokoly proxy + audit MCP + rozhodnutí o směrování)
Schémata: Zod (ověření I/O nástroje MCP, smlouvy API)
Protokoly: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
Streamování: Server-Sent Events (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + API klíče + MCP Scoped Authorization
Testování: Testovací program Node.js + Vitest (více než 900 testů včetně jednotky, integrace, E2E)
CI/CD: Akce GitHub (automatické publikování npm + Docker Hub při vydání)
Web: omniroute.online
Balík: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Odolnost: Jistič, exponenciální ústup, stádo proti hromům, TLS spoofing, auto-kombo samoléčení



📖 Dokumentace



Dokument
Popis




User Guide
Poskytovatelé, komba, integrace CLI, nasazení


API Reference
Všechny koncové body s příklady


MCP Server
16 MCP nástroje, konfigurace IDE, klienti Python/TS/Go


A2A Server
Protokol JSON-RPC 2.0, dovednosti, streamování, správa úloh


Auto-Combo Engine
6faktorové bodování, balíčky režimů, samoléčení


Troubleshooting
Běžné problémy a řešení


Architecture
Architektura systému a vnitřní části


Contributing
Vývojové nastavení a pokyny


OpenAPI Spec
Specifikace OpenAPI 3.0


Security Policy
Hlášení zranitelnosti a bezpečnostní postupy


VM Deployment
Kompletní průvodce: Nastavení VM + nginx + Cloudflare


Features Gallery
Vizuální prohlídka řídicího panelu se snímky obrazovky


Release Checklist
Kroky ověření před vydáním




🗺️ Cestovní mapa
OmniRoute má naplánováno 210+ funkcí v několika fázích vývoje. Zde jsou klíčové oblasti:



Kategorie
Plánované funkce
Hlavní body




🧠 Směrování a inteligence
25+
Směrování s nejnižší latencí, směrování založené na značkách, předběžná kontrola kvót, výběr účtu P2C


🔒 Zabezpečení a dodržování předpisů
20+
Zpevnění SSRF, maskování pověření, rychlostní limit na koncový bod, stanovení rozsahu klíče managementu


📊 Pozorovatelnost
15+
Integrace OpenTelemetry, sledování kvót v reálném čase, sledování nákladů na model


🔄 Integrace poskytovatelů
20+
Registr dynamického modelu, cooldowny poskytovatelů, kodex pro více účtů, analýza kvót Copilota


⚡ Výkon
15+
Dual cache layer, prompt cache, response cache, streaming keepalive, batch API


🌐 Ekosystém
10+
WebSocket API, konfigurace hot-reload, distribuované úložiště konfigurace, komerční režim



🔜 Již brzy

🔗 Integrace OpenCode – Podpora nativního poskytovatele pro IDE kódování OpenCode AI
🔗 ** Integrace TRAE** — Plná podpora pro vývojový rámec TRAE AI
📦 Batch API — Asynchronní dávkové zpracování pro hromadné požadavky
🎯 Směrování založené na značkách – Směrování požadavků na základě vlastních značek a metadat
💰 Strategie nejnižších nákladů — Automaticky vyberte nejlevnějšího dostupného poskytovatele


📝 Kompletní specifikace funkcí k dispozici v OMNI_TOKEN_342 (217 podrobných specifikací)


👥 Přispěvatelé

Jak přispět

Fork úložiště
Vytvořte si větev funkcí (git checkout -b feature/amazing-feature)
Potvrďte změny (git commit -m 'Add amazing feature')
Zatlačte na pobočku (git push origin feature/amazing-feature)
Otevřete požadavek na stažení

Podrobné pokyny viz CONTRIBUTING.md.
Vydání nové verze
# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes

📊 Hvězdná historie
Hvězdáři v průběhu času

🙏 Poděkování
Zvláštní poděkování patří 9router od decolua – původnímu projektu, který inspiroval tuto vidlici. OmniRoute staví na tomto neuvěřitelném základu s dalšími funkcemi, multimodálními API a úplným přepsáním TypeScriptu.
Zvláštní poděkování patří CLIProxyAPI – původní implementaci Go, která inspirovala tento port JavaScriptu.

📄 Licence
Licence MIT – podrobnosti viz LICENSE.


  _{Vytvořeno pomocí ❤️ pro vývojáře, kteří kódují 24/7}
  

  _{omniroute.online}

Krok	Akce	Poskytovatelé odemčeni
1	Connect Kiro (AWS Builder ID OAuth)	Claude Sonnet 4.5, Haiku 4.5 — neomezeno
2	Připojte iFlow (Google OAuth)	kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... — bez omezení
3	Připojte Qwen (kód zařízení)	qwen3-coder-plus, qwen3-coder-flash... — bez omezení
4	Připojte Gemini CLI (Google OAuth)	gemini-3-flash, gemini-2.5-pro — 180 000/měsíc zdarma
5	`/dashboard/combos` → Šablona Stack zdarma (0 $)	Round-robin všechny bezplatné poskytovatele automaticky

Model	Předpona	Limit	Limit sazby
`claude-sonnet-4.5`	`kr/`	Neomezeno	Žádný hlášený denní limit
`claude-haiku-4.5`	`kr/`	Neomezeno	Žádný hlášený denní limit
`claude-opus-4.6`	`kr/`	Neomezeno	Nejnovější Opus přes Kiro

Model	Předpona	Limit	Limit sazby
`kimi-k2-thinking`	`if/`	Neomezeno	Žádný nahlášený strop
`qwen3-coder-plus`	`if/`	Neomezeno	Žádný nahlášený strop
`deepseek-r1`	`if/`	Neomezeno	Žádný nahlášený strop
`minimax-m2.1`	`if/`	Neomezeno	Žádný nahlášený strop
`kimi-k2`	`if/`	Neomezeno	Žádný nahlášený strop

Model	Předpona	Limit	Limit sazby
`qwen3-coder-plus`	`qw/`	Neomezeno	Žádný nahlášený strop
`qwen3-coder-flash`	`qw/`	Neomezeno	Žádný nahlášený strop
`qwen3-coder-next`	`qw/`	Neomezeno	Žádný nahlášený strop
`vision-model`	`qw/`	Neomezeno	Multimodální (obrázky)

Poskytovatel	Kredity zdarma	Nejlepší modelka	Limit sazby
🢢 Deepgram	200 $ zdarma (registrace)	`nova-3` — nejvyšší přesnost, více než 30 jazyků	Žádný limit RPM na bezplatné kredity
🔵 SestaveníAI	50 $ zdarma (registrace)	`universal-3-pro` — kapitoly, sentiment, PII	Žádný limit RPM na bezplatné kredity
🔴 Groq	Navždy zdarma	`whisper-large-v3` — OpenAI Whisper	30 RPM (rychlost omezená)

Příkaz	Popis
`omniroute`	Spustit server (`PORT=20128`, API a řídicí panel na stejném portu)
`omniroute --port 3000`	Nastavte kanonický/API port na 3000
`omniroute --mcp`	Spustit MCP server (stdio transport)
`omniroute --no-open`	Neotevírat automaticky prohlížeč
`omniroute --help`	Zobrazit nápovědu

Obrázek	Štítek	Velikost	Popis
`diegosouzapw/omniroute`	`latest`	~250 MB	Poslední stabilní verze
`diegosouzapw/omniroute`	`1.0.3`	~250 MB	Aktuální verze

Úroveň	Poskytovatel	Cena	Obnovení kvóty	Nejlepší pro
💳 PŘEDPLATNÉ	Claude Code (Pro)	20 $/měsíc	5h + týdně	Již přihlášeno
	Codex (Plus/Pro)	20–200 USD/měsíc	5h + týdně	Uživatelé OpenAI
	Gemini CLI	ZDARMA	180 tis./měsíc + 1 tis./den	Každý!
	GitHub Copilot	10–19 USD/měsíc	Měsíčně	Uživatelé GitHubu
🔑 API KEY	NVIDIA NIM	ZDARMA (dev forever)	~40 RPM	70+ otevřených modelů
	Cerebras	ZDARMA (1 milion toku/den)	60 000 TPM / 30 RPM	Nejrychlejší na světě
	Groq	ZDARMA (30 RPM)	14,4K RPD	Ultra rychlá lama/gemma
	DeepSeek V3.2	0,27 `/ 1,10` za 1 milion	Žádné	Nejlepší zdůvodnění cena/kvalita
	xAI Grok-4 Fast	0,20 `/0,50` za 1M 🆕	Žádné	Nejrychlejší + volání nástroje, ultranízké
	xAI Grok-4 (standardní)	0,20 `/1,50` za 1M 🆕	Žádné	Reasoning vlajková loď od xAI
	Mistral	Vyzkoušení zdarma + placené	Omezená sazba	Evropská umělá inteligence
	OpenRouter	Platba za použití	Žádné	100+ modelů agr.
💰 LEVNĚ	GLM-5 (přes Z.AI) 🆕	0,5 $/1 mil.	Denně 10:00	128K výstup, nejnovější vlajková loď
	GLM-4.7	0,6 $/1 mil.	Denně 10:00	Záloha rozpočtu
	MiniMax M2,5 🆕	Vstup 0,3 $/1 milion	5hodinové válcování	Úvahy + agentské úkoly
	MiniMax M2.1	0,2 $/1 mil.	5hodinové válcování	Nejlevnější varianta
	Kimi K2.5 (Moonshot API) 🆕	Platba za použití	Žádné	Přímý přístup Moonshot API
	Kimi K2	9 $/měsíc byt	10 milionů tokenů/měsíc	Předvídatelné náklady
🆓 ZDARMA	iFlow	$0	Neomezené	5 modelů neomezeně
	Qwen	$0	Neomezené	4 modely neomezeně
	Kiro	$0	Neomezené	Claude Sonnet/Haiku (stavitel AWS)
	LongCat Flash-Lite 🆕	$0 (50 milionů toku/den 🔥)	1 RPS	Největší bezplatná kvóta na Zemi
	Opylování AI 🆕	$0 (není potřeba žádný klíč)	1 požadavek/15s	GPT-5, Claude, DeepSeek, Llama 4
	Cloudflare Workers AI 🆕	$0 (10 000 neuronů/den)	~150 resp./den	50+ modelů, globální náskok
	Scaleway AI 🆕	$0 (celkem 1 milion tokenů)	Omezená sazba	EU/GDPR, Qwen3 235B, Lama 70B

Model	Předpona	Limit	Limit sazby
`gemini-3-flash-preview`	`gc/`	180 tis./měsíc + 1 tis./den	Měsíční reset
`gemini-2.5-pro`	`gc/`	180 tis./měsíc (sdílený bazén)	Vysoká kvalita

Model	Předpona	Denní kvóta zdarma	Poznámky
`LongCat-Flash-Lite`	`lc/`	50 milionů žetonů 💥	Největší bezplatná kvóta všech dob
`LongCat-Flash-Chat`	`lc/`	500 000 tokenů	Víceotáčkový chat
`LongCat-Flash-Thinking`	`lc/`	500 000 tokenů	Zdůvodnění / CoT
`LongCat-Flash-Thinking-2601`	`lc/`	500 000 tokenů	Verze z ledna 2026
`LongCat-Flash-Omni-2603`	`lc/`	500 000 tokenů	Multimodální

Model	Předpona	Limit sazby	Poskytovatel za
`openai`	`pol/`	1 požadavek/15s	GPT-5
`claude`	`pol/`	1 požadavek/15s	Antropický Claude
`gemini`	`pol/`	1 požadavek/15s	Google Gemini
`deepseek`	`pol/`	1 požadavek/15s	DeepSeek V3
`llama`	`pol/`	1 požadavek/15s	Meta Llama 4 Scout
`mistral`	`pol/`	1 požadavek/15s	Mistral AI

Funkce	Co to dělá
⚡ Grok-4 Fast Family	xAI modely za 0,20 $/0,50 $/M – srovnávací 1143 ms (o 30 % rychlejší než Gemini 2.5 Flash)
🧠 GLM-5 přes Z.AI	128 000 výstupní kontext, 0,5 $/1 milion – nejnovější vlajková loď z rodiny GLM
🔮 MiniMax M2.5	Úvahy + agentní úkoly za 0,30 $/1 milion – významný upgrade z M2,1
🎯 toolCalling Flag na model	Pro model `toolCalling: true/false` v registru – AutoCombo přeskočí modely, které nepodporují nástroje
🌍 Multilingual Intent Detection	Klíčová slova PT/ZH/ES/AR v hodnocení AutoCombo – lepší výběr modelu pro neanglický obsah
📊 Zástupy založené na benchmarku	Skutečná latence p95 z kombinovaného bodování zdrojů živých požadavků – AutoCombo se učí ze skutečných dat
🔁 Požádat o deduplikaci	Okno pro odstranění duplicitního obsahu založené na hašování obsahu – bezpečné pro více agentů, zabraňuje duplicitním poplatkům
🔌 Strategie připojitelného směrovače	Rozšiřitelné rozhraní `RouterStrategy` – přidat vlastní logiku směrování jako zásuvné moduly

Funkce	Co to dělá
🎮 Modelové hřiště	Stránka řídicího panelu pro přímé testování jakéhokoli modelu — voliče poskytovatele/modelu/koncového bodu, editor Monaco, streamování, přerušení, načasování
🔏 CLI Fingerprint Matching	Uspořádání záhlaví/těla podle poskytovatele tak, aby odpovídalo nativním signaturám CLI – přepněte podle poskytovatele v Nastavení > Zabezpečení. Vaše IP adresa proxy je zachována
🤝 Podpora ACP (Protokol klienta agenta)	Zjišťování agentů CLI (Codex, Claude, Goose, Gemini CLI, OpenClaw + 9 dalších), zpracovatel procesů, koncový bod `/api/acp/agents`
🤖 Hlavní panel agentů AKT	Debug › Stránka Agenti — mřížka 14 agentů se stavem instalace, verzí, uživatelským formulářem agenta pro libovolný nástroj CLI. Uživatelé OpenCode získají tlačítko „Stáhnout opencode.json“, které automaticky vygeneruje konfiguraci připravenou k použití se všemi dostupnými modely.
🔧 Vlastní model `apiFormat` Směrování	Vlastní modely s `apiFormat: "responses"` nyní správně směrují do překladače Responses API
🏢 Codex Workspace Isolation	Více pracovních prostorů Codex na e-mail — OAuth správně odděluje připojení podle ID pracovního prostoru
🔄 Elektronová automatická aktualizace	Desktopová aplikace kontroluje aktualizace + automatická instalace při restartu

Funkce	Co to dělá
🔧 MCP Server (16 nástrojů)	Nástroje IDE/agenta prostřednictvím 3 přenosů: stdio, SSE (`/api/mcp/sse`), Streamable HTTP (`/api/mcp/stream`)
🤝 Server A2A (JSON-RPC + SSE)	Provádění úlohy agent-agent se synchronizací a streamováním
🧭 Stránka konsolidovaných koncových bodů	Stránka správy s kartami s kartami Endpoint Proxy, MCP, A2A a API Endpoints
🎚️ Přepínače aktivace/deaktivace služby	Spínače ON/OFF pro MCP a A2A s trvalým nastavením (výchozí: OFF)
🛰️ MCP Runtime Heartbeat	Skutečný stav procesu (pid, doba provozu, doba srdečního tepu, transport, režim rozsahu)
📋 MCP Audit Trail	Filtrovatelné protokoly auditu s úspěchem/neúspěchem a přiřazením klíče
🔐 Vymáhání rozsahu MCP	9 podrobných oprávnění rozsahu pro řízený přístup k nástroji
📡 A2A Task Lifecycle Management	Vypsat/filtrovat úlohy, zkontrolovat události/artefakty, zrušit běžící úlohy
📋 Zjištění karty agenta	`/.well-known/agent.json` pro automatické zjišťování klienta
🧪 Protokol E2E Test Harness	Skutečné toky MCP SDK + A2A klient v `test:protocols:e2e`
⚙️ Provozní ovládací prvky	Kombinace přepínačů, použití profilů odolnosti, resetování jističů z jedné ovládací plochy

Funkce	Co to dělá
🎯 Chytrý 4úrovňový záložní zdroj	Automatická trasa: Předplatné → Klíč API → Levné → Zdarma
📊 Sledování kvót v reálném čase	Živý počet tokenů + reset odpočítávání na poskytovatele
🔄 Formátový překlad	OpenAI ↔ Claude ↔ Gemini ↔ Odpovědi s převody bezpečnými pro schéma
👥 Podpora více účtů	Více účtů na poskytovatele s inteligentním výběrem
🔄 Automatické obnovení tokenu	Tokeny OAuth se automaticky obnovují s opakováním
🎨 Vlastní kombinace	6 vyvažovacích strategií + řízení záložního řetězce
🌐 Wildcard Router	`provider/*` dynamické směrování
🧠 Přemýšlení o kontrolách rozpočtu	Limity průchozího, automatického, vlastního a adaptivního uvažování
🔀 Aliasy modelů	Vestavěný + vlastní model aliasing a bezpečnost migrace
⚡ Degradace pozadí	Směrujte úlohy s nízkou prioritou na pozadí na levnější modely
🧪 Inteligentní směrování s ohledem na úkoly	Automatický výběr modelu podle typu obsahu (kódování/vize/analýza/souhrn)
💬 System Prompt Injection	Globální ovládací prvky chování používané konzistentně
📄 Kompatibilita rozhraní Responses API	Plná podpora `/v1/responses` pro Codex a pokročilé agentní pracovní postupy

Funkce	Co to dělá
🖼️ Generování obrázků	`/v1/images/generations` s cloudem a místními backendy
📐 Vložení	`/v1/embeddings` pro vyhledávací a RAG potrubí
🎤 Přepis zvuku	`/v1/audio/transcriptions` — 7 poskytovatelů (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), automatická detekce jazyka, podpora MP4/MP3/WAV
🔊 Převod textu na řeč	`/v1/audio/speech` — 10 poskytovatelů (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) se správnými chybovými zprávami
🎬 Generace videa	`/v1/videos/generations` (pracovní postupy ComfyUI + SD WebUI)
🎵 Music Generation	`/v1/music/generations` (pracovní postupy ComfyUI)
🛡️ Moderování	`/v1/moderations` bezpečnostní kontroly
🔀 Reranking	`/v1/rerank` pro hodnocení relevance
🔍 Vyhledávání na webu 🆕	`/v1/search` — 5 poskytovatelů (Serper, Brave, Perplexity, Exa, Tavily), 6 500+ zdarma/měsíc, auto-failover, cache

Funkce	Co to dělá
🔌 Jističe	Vypnutí/obnovení pro každý model s ovládáním prahu
🎯 modely s důrazem na koncové body	Vlastní modely deklarují podporované koncové body + formát API
🛡️ Stádo proti hromům	Mutex + semaforové ochrany při opakování/rychlosti událostí
🧠 Sémantická + mezipaměť podpisů	Snížení nákladů/latence se dvěma vrstvami mezipaměti
⚡ Žádost o idempotenci	Duplicitní ochranné okno
🔒 TLS Fingerprint Spoofing	Otisk TLS jako v prohlížeči — snižuje detekci robotů a nahlašování účtu
🔏 CLI Fingerprint Matching	Odpovídá nativním podpisům požadavku CLI — snižuje riziko zákazu při zachování proxy IP
🌐 Filtrování IP	Kontrola seznamu povolených/blokovaných pro vystavená nasazení
📊 Upravitelné limity sazeb	Konfigurovatelné globální limity/limity na úrovni poskytovatele s perzistencí
🔑 Správa klíčů API + rozsah	Bezpečné vydávání/otočení klíčů a ovládání modelu/poskytovatele
🛡️ Chráněno `/models`	Volitelné ověřování a skrytí poskytovatele pro katalog modelů

Funkce	Co to dělá
📝 Požadavek + protokolování proxy	Úplný požadavek/odpověď a protokolování proxy
📉 Streamed Detailed Logs 🆕	Reconstructs SSE payload streams cleanly into the UI
📋 Sjednocený panel protokolů	Požadavek, proxy, audit a zobrazení konzoly na jedné stránce
🔍 Požádejte o telemetrii	p50/p95/p99 latence a trasování požadavků
🏥 Health Dashboard	Doba provozuschopnosti, stavy jističe, uzamčení, statistiky mezipaměti
💰 Sledování nákladů	Kontroly rozpočtu a viditelnost cen podle modelu
📈 Analytické vizualizace	Statistiky využití modelu/poskytovatele a zobrazení trendů
🧪 Rámec hodnocení	Testování zlaté sady s konfigurovatelnými strategiemi shody

Funkce	Co to dělá
🌐 Nasadit kdekoli	Localhost, VPS, Docker, cloudová prostředí
💾 Cloud Sync	Synchronizace konfigurace přes cloud worker
🔄 Zálohování/Obnova	Export/import a toky obnovy po havárii
🧙 Průvodce onboardingem	První spuštění průvodce nastavením
🔧 CLI Tools Dashboard	Nastavení jedním kliknutím pro oblíbené kódovací nástroje
🎮 Modelové hřiště	Otestujte libovolného poskytovatele/model/koncový bod z řídicího panelu
🔏 CLI Fingerprint Toggle	Shoda otisků prstů jednotlivých poskytovatelů v Nastavení > Zabezpečení
🌐 i18n (30 jazyků)	Plná podpora řídicího panelu + docs s pokrytím RTL
🧹 Vymazat všechny modely	Vymazání seznamu modelů jedním kliknutím v detailech poskytovatele
👁️ Sidebar Controls 🆕	Hide components and integrations from Appearance Settings
📋 Šablony vydání	Standardizované šablony GitHub pro chyby a funkce
📂 Custom Data Directory	`DATA_DIR` přepsání umístění úložiště

Strategie	Popis	Příklad
`exact`	Výstup se musí přesně shodovat	`"4"`
`contains`	Výstup musí obsahovat podřetězec (nerozlišují se malá a velká písmena)	`"Paris"`
`regex`	Výstup musí odpovídat vzoru regulárního výrazu	`"1.2.3"`
`custom`	Vlastní funkce JS vrací true/false	`(output) => output.length > 10`

Dokument	Popis
User Guide	Poskytovatelé, komba, integrace CLI, nasazení
API Reference	Všechny koncové body s příklady
MCP Server	16 MCP nástroje, konfigurace IDE, klienti Python/TS/Go
A2A Server	Protokol JSON-RPC 2.0, dovednosti, streamování, správa úloh
Auto-Combo Engine	6faktorové bodování, balíčky režimů, samoléčení
Troubleshooting	Běžné problémy a řešení
Architecture	Architektura systému a vnitřní části
Contributing	Vývojové nastavení a pokyny
OpenAPI Spec	Specifikace OpenAPI 3.0
Security Policy	Hlášení zranitelnosti a bezpečnostní postupy
VM Deployment	Kompletní průvodce: Nastavení VM + nginx + Cloudflare
Features Gallery	Vizuální prohlídka řídicího panelu se snímky obrazovky
Release Checklist	Kroky ověření před vydáním

Kategorie	Plánované funkce	Hlavní body
🧠 Směrování a inteligence	25+	Směrování s nejnižší latencí, směrování založené na značkách, předběžná kontrola kvót, výběr účtu P2C
🔒 Zabezpečení a dodržování předpisů	20+	Zpevnění SSRF, maskování pověření, rychlostní limit na koncový bod, stanovení rozsahu klíče managementu
📊 Pozorovatelnost	15+	Integrace OpenTelemetry, sledování kvót v reálném čase, sledování nákladů na model
🔄 Integrace poskytovatelů	20+	Registr dynamického modelu, cooldowny poskytovatelů, kodex pro více účtů, analýza kvót Copilota
⚡ Výkon	15+	Dual cache layer, prompt cache, response cache, streaming keepalive, batch API
🌐 Ekosystém	10+	WebSocket API, konfigurace hot-reload, distribuované úložiště konfigurace, komerční režim

108 KiB Raw Blame History Unescape Escape

🚀 OmniRoute — bezplatná brána umělé inteligence

Nikdy nepřestávejte kódovat. Chytré směrování na BEZPLATNÉ a levné modely s umělou inteligencí s automatickým zálohováním.

🆕 Co je nového ve verzi 3.0.0

🖼️ Hlavní panel

📸 Náhled řídicího panelu

🤖 Bezplatný poskytovatel AI pro vaše oblíbené kódovací agenty

🤔 Proč OmniRoute?

📧 Podpora

🐛 Nahlásit chybu?

🔄 Jak to funguje

🎯 Co řeší OmniRoute — 30 bodů skutečné bolesti a případy použití

Vzorové příručky (integrované případy použití)

🆓 Začněte zdarma — nulové náklady na konfiguraci

⚡ Rychlý start

1) Nainstalujte a spusťte

2) Připojte poskytovatele a vytvořte si klíč API

3) Nasměrujte svůj kódovací nástroj na OmniRoute

4) Povolte a ověřte protokoly (v2.0)

5) Ověřte vše od začátku do konce (doporučeno)

Alternativa: spustit ze zdroje

🐳 Docker

🖥️ Desktopová aplikace — offline a vždy zapnutá

Rychlý start

Systémová lišta

💰 Přehled cen

🆓 Modely zdarma — to, co skutečně získáte

🔵 CLAUDE MODELS (přes Kiro — AWS Builder ID)

🢢 MODELY IFLOW (bezplatný protokol OAuth – žádná kreditní karta)

🡡 QWEN MODELS (Auth Code Auth)

🟣 GEMINI CLI (Google OAuth)

⚫ NVIDIA NIM (bezplatný klíč API — build.nvidia.com)

⚪ CEREBRAS (Free API Key — inference.cerebras.ai)

🔴 GROQ (Free API Key — console.groq.com)

🔴 LONGCAT AI (bezplatný klíč API — longcat.chat) 🆕

🢢 POLLINATIONS AI (nevyžaduje se žádný klíč API) 🆕

🟠 CLOUDFLARE WORKERS AI (Free API Key — cloudflare.com) 🆕

🟣 SCALEWAY AI (1 milion bezplatných tokenů — scaleway.com) 🆕

🎙️ Kombinace bezplatných přepisů

💡 Klíčové vlastnosti

🆕 Novinka — Vylepšení inspirovaná ClawRouterem (březen 2026)

🚀 Předchozí v2.0.9+ — Hřiště, CLI Fingerprints & ACP

🤖 Operace agentů a protokolů (v2.0)

🧠 Směrování a inteligence

🎵 Multimodální API

🛡️ Odolnost, bezpečnost a správa

📊 Pozorovatelnost a analytika

☁️ Nasazení a platforma

Funkce Deep Dive

Chytrá záloha s praktickou kontrolou nákladů

Správa protokolu, která je viditelná a ovladatelná

Pracovní postup překladatele + ověřování

🧪 Hodnocení (Evals)

Vestavěná zlatá sada

Strategie hodnocení

📖 Průvodce nastavením

Nastavení protokolu (MCP + A2A)

Claude Code (Pro/Max)

OpenAI Codex (Plus/Pro)

Správa limitu účtu Codex (5 hodin + týdně)

Gemini CLI (ZDARMA 180 000/měsíc!)

GitHub Copilot

NVIDIA NIM (BEZPLATNÝ přístup pro vývojáře — 70+ modelů)

DeepSeek

Groq (dostupná bezplatná úroveň!)

OpenRouter (100+ modelů)

GLM-4,7 (denní reset, 0,6 $/1 milion)

MiniMax M2.1 (5h reset, $0.20/1M)

Kimi K2 (9 $ měsíčně byt)

iFlow (5 ZDARMA modelů přes OAuth)

Qwen (4 ZDARMA modely prostřednictvím kódu zařízení)

Kiro (Claude FREE)

Příklad 1: Maximalizujte předplatné → Levné zálohování

Příklad 2: Pouze zdarma (nulové náklady)

IDE kurzoru

Claudeův kód

Codex CLI

OpenClaw

Cline / Pokračovat / RooCode

OpenCode

108 KiB

Raw Blame History