# OmniRoute Architecture ๐ŸŒ **Languages:** ๐Ÿ‡บ๐Ÿ‡ธ [English](../../ARCHITECTURE.md) | ๐Ÿ‡ง๐Ÿ‡ท [Portuguรชs (Brasil)](../pt-BR/ARCHITECTURE.md) | ๐Ÿ‡ช๐Ÿ‡ธ [Espaรฑol](../es/ARCHITECTURE.md) | ๐Ÿ‡ซ๐Ÿ‡ท [Franรงais](../fr/ARCHITECTURE.md) | ๐Ÿ‡ฎ๐Ÿ‡น [Italiano](../it/ARCHITECTURE.md) | ๐Ÿ‡ท๐Ÿ‡บ [ะ ัƒััะบะธะน](../ru/ARCHITECTURE.md) | ๐Ÿ‡จ๐Ÿ‡ณ [ไธญๆ–‡ (็ฎ€ไฝ“)](../zh-CN/ARCHITECTURE.md) | ๐Ÿ‡ฉ๐Ÿ‡ช [Deutsch](../de/ARCHITECTURE.md) | ๐Ÿ‡ฎ๐Ÿ‡ณ [เคนเคฟเคจเฅเคฆเฅ€](../in/ARCHITECTURE.md) | ๐Ÿ‡น๐Ÿ‡ญ [เน„เธ—เธข](../th/ARCHITECTURE.md) | ๐Ÿ‡บ๐Ÿ‡ฆ [ะฃะบั€ะฐั—ะฝััŒะบะฐ](../uk-UA/ARCHITECTURE.md) | ๐Ÿ‡ธ๐Ÿ‡ฆ [ุงู„ุนุฑุจูŠุฉ](../ar/ARCHITECTURE.md) | ๐Ÿ‡ฏ๐Ÿ‡ต [ๆ—ฅๆœฌ่ชž](../ja/ARCHITECTURE.md) | ๐Ÿ‡ป๐Ÿ‡ณ [Tiแบฟng Viแป‡t](../vi/ARCHITECTURE.md) | ๐Ÿ‡ง๐Ÿ‡ฌ [ะ‘ัŠะปะณะฐั€ัะบะธ](../bg/ARCHITECTURE.md) | ๐Ÿ‡ฉ๐Ÿ‡ฐ [Dansk](../da/ARCHITECTURE.md) | ๐Ÿ‡ซ๐Ÿ‡ฎ [Suomi](../fi/ARCHITECTURE.md) | ๐Ÿ‡ฎ๐Ÿ‡ฑ [ืขื‘ืจื™ืช](../he/ARCHITECTURE.md) | ๐Ÿ‡ญ๐Ÿ‡บ [Magyar](../hu/ARCHITECTURE.md) | ๐Ÿ‡ฎ๐Ÿ‡ฉ [Bahasa Indonesia](../id/ARCHITECTURE.md) | ๐Ÿ‡ฐ๐Ÿ‡ท [ํ•œ๊ตญ์–ด](../ko/ARCHITECTURE.md) | ๐Ÿ‡ฒ๐Ÿ‡พ [Bahasa Melayu](../ms/ARCHITECTURE.md) | ๐Ÿ‡ณ๐Ÿ‡ฑ [Nederlands](../nl/ARCHITECTURE.md) | ๐Ÿ‡ณ๐Ÿ‡ด [Norsk](../no/ARCHITECTURE.md) | ๐Ÿ‡ต๐Ÿ‡น [Portuguรชs (Portugal)](../pt/ARCHITECTURE.md) | ๐Ÿ‡ท๐Ÿ‡ด [Romรขnฤƒ](../ro/ARCHITECTURE.md) | ๐Ÿ‡ต๐Ÿ‡ฑ [Polski](../pl/ARCHITECTURE.md) | ๐Ÿ‡ธ๐Ÿ‡ฐ [Slovenฤina](../sk/ARCHITECTURE.md) | ๐Ÿ‡ธ๐Ÿ‡ช [Svenska](../sv/ARCHITECTURE.md) | ๐Ÿ‡ต๐Ÿ‡ญ [Filipino](../phi/ARCHITECTURE.md) _Huling na-update: 2026-02-18_ ## Executive Summary Ang OmniRoute ay isang lokal na AI routing gateway at dashboard na binuo sa Next.js. Nagbibigay ito ng isang endpoint na katugma sa OpenAI (`/v1/*`) at niruruta ang trapiko sa maraming upstream provider na may pagsasalin, fallback, pag-refresh ng token, at pagsubaybay sa paggamit. Mga pangunahing kakayahan: - OpenAI-compatible na API surface para sa CLI/tools (28 provider) - Kahilingan/tugon sa pagsasalin sa mga format ng provider - Modelong combo fallback (multi-model sequence) - Account-level fallback (multi-account bawat provider) - Pamamahala ng koneksyon ng provider ng OAuth + API-key - Pag-embed ng henerasyon sa pamamagitan ng `/v1/embeddings` (6 na provider, 9 na modelo) - Pagbuo ng larawan sa pamamagitan ng `/v1/images/generations` (4 na provider, 9 na modelo) - Isipin ang pag-parse ng tag (`...`) para sa mga modelo ng pangangatwiran - Response sanitization para sa mahigpit na OpenAI SDK compatibility - Pag-normalize ng tungkulin (developerโ†’system, systemโ†’user) para sa cross-provider compatibility - Structured output conversion (json_schema โ†’ Gemini responseSchema) - Lokal na pagtitiyaga para sa mga provider, key, alias, combo, setting, pagpepresyo - Pagsubaybay sa paggamit/gastos at pag-log ng kahilingan - Opsyonal na cloud sync para sa multi-device/state sync - IP allowlist/blocklist para sa API access control - Pag-iisip ng pamamahala sa badyet (passthrough/auto/custom/adaptive) - Global system prompt injection - Pagsubaybay sa session at fingerprinting - Paglilimita sa pinahusay na rate ng bawat account gamit ang mga profile na partikular sa provider - Pattern ng circuit breaker para sa katatagan ng provider - Proteksyon laban sa dumadagundong na kawan na may mutex locking - Nakabatay sa lagda ang cache ng pag-deduplication ng kahilingan - Layer ng domain: availability ng modelo, mga panuntunan sa gastos, patakaran sa fallback, patakaran sa lockout - Pananatili ng estado ng domain (SQLite write-through cache para sa mga fallback, badyet, lockout, circuit breaker) - Policy engine para sa sentralisadong pagsusuri ng kahilingan (lockout โ†’ budget โ†’ fallback) - Humiling ng telemetry na may p50/p95/p99 latency aggregation - Correlation ID (X-Request-Id) para sa end-to-end na pagsubaybay - Pag-log sa audit ng pagsunod gamit ang opt-out sa bawat API key - Eval framework para sa katiyakan ng kalidad ng LLM - Resilience UI dashboard na may real-time na status ng circuit breaker - Modular OAuth providers (12 indibidwal na module sa ilalim ng `src/lib/oauth/providers/`) Pangunahing modelo ng runtime: - Ang mga ruta ng Next.js app sa ilalim ng `src/app/api/*` ay nagpapatupad ng parehong dashboard API at compatibility API - Isang nakabahaging SSE/routing core sa `src/sse/*` + `open-sse/*` ang humahawak sa pagpapatupad ng provider, pagsasalin, streaming, fallback, at paggamit ## Saklaw at Hangganan ### Nasa Saklaw - Lokal na gateway runtime - Mga API sa pamamahala ng dashboard - Pagpapatunay ng provider at pag-refresh ng token - Humiling ng pagsasalin at SSE streaming - Lokal na estado + pagtitiyaga sa paggamit - Opsyonal na cloud sync orchestration ### Wala sa Saklaw - Pagpapatupad ng serbisyo sa cloud sa likod ng `NEXT_PUBLIC_CLOUD_URL` - Provider SLA/control plane sa labas ng lokal na proseso - Mga panlabas na CLI binary mismo (Claude CLI, Codex CLI, atbp.) ## Mataas na Antas na Konteksto ng System ```mermaid flowchart LR subgraph Clients[Developer Clients] C1[Claude Code] C2[Codex CLI] C3[OpenClaw / Droid / Cline / Continue / Roo] C4[Custom OpenAI-compatible clients] BROWSER[Browser Dashboard] end subgraph Router[OmniRoute Local Process] API[V1 Compatibility API\n/v1/*] DASH[Dashboard + Management API\n/api/*] CORE[SSE + Translation Core\nopen-sse + src/sse] DB[(db.json)] UDB[(usage.json + log.txt)] end subgraph Upstreams[Upstream Providers] P1[OAuth Providers\nClaude/Codex/Gemini/Qwen/iFlow/GitHub/Kiro/Cursor/Antigravity] P2[API Key Providers\nOpenAI/Anthropic/OpenRouter/GLM/Kimi/MiniMax\nDeepSeek/Groq/xAI/Mistral/Perplexity\nTogether/Fireworks/Cerebras/Cohere/NVIDIA] P3[Compatible Nodes\nOpenAI-compatible / Anthropic-compatible] end subgraph Cloud[Optional Cloud Sync] CLOUD[Cloud Sync Endpoint\nNEXT_PUBLIC_CLOUD_URL] end C1 --> API C2 --> API C3 --> API C4 --> API BROWSER --> DASH API --> CORE DASH --> DB CORE --> DB CORE --> UDB CORE --> P1 CORE --> P2 CORE --> P3 DASH --> CLOUD ``` ## Mga Pangunahing Bahagi ng Runtime ## 1) API at Routing Layer (Next.js App Routes) Mga pangunahing direktoryo: - `src/app/api/v1/*` at `src/app/api/v1beta/*` para sa mga compatibility API - `src/app/api/*` para sa mga management/configuration API - Susunod na muling pagsusulat sa `next.config.mjs` mapa `/v1/*` hanggang `/api/v1/*` Mahahalagang ruta ng compatibility: - `src/app/api/v1/chat/completions/route.ts` - `src/app/api/v1/messages/route.ts` - `src/app/api/v1/responses/route.ts` - `src/app/api/v1/models/route.ts` โ€” kasama ang mga custom na modelo na may `custom: true` - `src/app/api/v1/embeddings/route.ts` โ€” henerasyon ng pag-embed (6 na provider) - `src/app/api/v1/images/generations/route.ts` โ€” pagbuo ng larawan (4+ provider kasama ang Antigravity/Nebius) - `src/app/api/v1/messages/count_tokens/route.ts` - `src/app/api/v1/providers/[provider]/chat/completions/route.ts` โ€” nakatuon sa bawat provider na chat - `src/app/api/v1/providers/[provider]/embeddings/route.ts` โ€” nakalaang mga pag-embed ng bawat provider - `src/app/api/v1/providers/[provider]/images/generations/route.ts` โ€” nakalaang mga larawan ng bawat provider - `src/app/api/v1beta/models/route.ts` - `src/app/api/v1beta/models/[...path]/route.ts` Mga domain ng pamamahala: - Auth/setting: `src/app/api/auth/*`, `src/app/api/settings/*` - Mga provider/koneksyon: `src/app/api/providers*` - Mga node ng provider: `src/app/api/provider-nodes*` - Mga custom na modelo: `src/app/api/provider-models` (GET/POST/DELETE) - Catalog ng modelo: `src/app/api/models/catalog` (GET) - Proxy config: `src/app/api/settings/proxy` (GET/PUT/DELETE) + `src/app/api/settings/proxy/test` (POST) - OAuth: `src/app/api/oauth/*` - Mga key/alias/combos/presyo: `src/app/api/keys*`, `src/app/api/models/alias`, `src/app/api/combos*`, `src/app/api/pricing` - Paggamit: `src/app/api/usage/*` - Sync/cloud: `src/app/api/sync/*`, `src/app/api/cloud/*` - CLI tooling helpers: `src/app/api/cli-tools/*` - IP filter: `src/app/api/settings/ip-filter` (GET/PUT) - Pag-iisip na badyet: `src/app/api/settings/thinking-budget` (GET/PUT) - System prompt: `src/app/api/settings/system-prompt` (GET/PUT) - Mga Sesyon: `src/app/api/sessions` (GET) - Mga limitasyon sa rate: `src/app/api/rate-limits` (GET) - Katatagan: `src/app/api/resilience` (GET/PATCH) โ€” mga profile ng provider, circuit breaker, estado ng limitasyon sa rate - Resilience reset: `src/app/api/resilience/reset` (POST) โ€” reset breakers + cooldowns - Mga istatistika ng cache: `src/app/api/cache/stats` (GET/DELETE) - Availability ng modelo: `src/app/api/models/availability` (GET/POST) - Telemetry: `src/app/api/telemetry/summary` (GET) - Badyet: `src/app/api/usage/budget` (GET/POST) - Fallback chain: `src/app/api/fallback/chains` (GET/POST/DELETE) - Pag-audit sa pagsunod: `src/app/api/compliance/audit-log` (GET) - Mga Eval: `src/app/api/evals` (GET/POST), `src/app/api/evals/[suiteId]` (GET) - Mga Patakaran: `src/app/api/policies` (GET/POST) ## 2) SSE + Core ng Pagsasalin Mga pangunahing module ng daloy: - Entry: `src/sse/handlers/chat.ts` - Core orchestration: `open-sse/handlers/chatCore.ts` - Mga adaptor ng pagpapatupad ng provider: `open-sse/executors/*` - Format detection/provider config: `open-sse/services/provider.ts` - Pag-parse/paglutas ng modelo: `src/sse/services/model.ts`, `open-sse/services/model.ts` - Logic ng fallback ng account: `open-sse/services/accountFallback.ts` - Pagpapatala ng pagsasalin: `open-sse/translator/index.ts` - Mga pagbabago sa stream: `open-sse/utils/stream.ts`, `open-sse/utils/streamHandler.ts` - Pagkuha/normalisasyon ng paggamit: `open-sse/utils/usageTracking.ts` - Isipin ang tag parser: `open-sse/utils/thinkTagParser.ts` - Handler ng pag-embed: `open-sse/handlers/embeddings.ts` - Pag-embed ng pagpapatala ng provider: `open-sse/config/embeddingRegistry.ts` - Handler ng pagbuo ng larawan: `open-sse/handlers/imageGeneration.ts` - Rehistro ng provider ng larawan: `open-sse/config/imageRegistry.ts` - Paglinis ng tugon: `open-sse/handlers/responseSanitizer.ts` - Pag-normalize ng tungkulin: `open-sse/services/roleNormalizer.ts` Mga Serbisyo (lohika ng negosyo): - Pagpili/pagmamarka ng account: `open-sse/services/accountSelector.ts` - Pamamahala ng lifecycle ng konteksto: `open-sse/services/contextManager.ts` - Pagpapatupad ng IP filter: `open-sse/services/ipFilter.ts` - Pagsubaybay sa session: `open-sse/services/sessionManager.ts` - Humiling ng deduplikasyon: `open-sse/services/signatureCache.ts` - System prompt injection: `open-sse/services/systemPrompt.ts` - Pag-iisip ng pamamahala sa badyet: `open-sse/services/thinkingBudget.ts` - Pagruruta ng modelo ng wildcard: `open-sse/services/wildcardRouter.ts` - Pamamahala sa limitasyon ng rate: `open-sse/services/rateLimitManager.ts` - Circuit breaker: `open-sse/services/circuitBreaker.ts` Mga module ng layer ng domain: - Availability ng modelo: `src/lib/domain/modelAvailability.ts` - Mga panuntunan/badyet ng gastos: `src/lib/domain/costRules.ts` - Patakaran sa Fallback: `src/lib/domain/fallbackPolicy.ts` - Combo solver: `src/lib/domain/comboResolver.ts` - Patakaran sa pag-lockout: `src/lib/domain/lockoutPolicy.ts` - Policy engine: `src/domain/policyEngine.ts` โ€” sentralisadong lockout โ†’ badyet โ†’ fallback evaluation - Catalog ng mga error code: `src/lib/domain/errorCodes.ts` - Request ID: `src/lib/domain/requestId.ts` - I-fetch ang timeout: `src/lib/domain/fetchTimeout.ts` - Humiling ng telemetry: `src/lib/domain/requestTelemetry.ts` - Pagsunod/pag-audit: `src/lib/domain/compliance/index.ts` - Eval runner: `src/lib/domain/evalRunner.ts` - Pananatili ng estado ng domain: `src/lib/db/domainState.ts` โ€” SQLite CRUD para sa mga fallback na chain, badyet, kasaysayan ng gastos, estado ng lockout, mga circuit breaker Mga module ng provider ng OAuth (12 indibidwal na file sa ilalim ng `src/lib/oauth/providers/`): - Registry index: `src/lib/oauth/providers/index.ts` - Mga indibidwal na tagapagbigay: `claude.ts`, `codex.ts`, `gemini.ts`, `antigravity.ts`, `iflow.ts`, `qwen.ts`, `github.ts`, `kiro.ts`, `cursor.ts`, `kilocode.ts`, `cline.ts` - Manipis na wrapper: `src/lib/oauth/providers.ts` โ€” muling pag-export mula sa mga indibidwal na module ## 3) Layer ng Pagtitiyaga Pangunahing estado DB: - `src/lib/localDb.ts` - file: `${DATA_DIR}/db.json` (o `$XDG_CONFIG_HOME/omniroute/db.json` kapag nakatakda, kung hindi `~/.omniroute/db.json`) - mga entity: providerConnections, providerNodes, modelAliases, combos, apiKeys, mga setting, pagpepresyo, **customModels**, **proxyConfig**, **ipFilter**, **thinkingBudget**, **systemPrompt** Paggamit ng DB: - `src/lib/usageDb.ts` - mga file: `${DATA_DIR}/usage.json`, `${DATA_DIR}/log.txt`, `${DATA_DIR}/call_logs/` - sumusunod sa parehong base na patakaran sa direktoryo gaya ng `localDb` (`DATA_DIR`, pagkatapos ay `XDG_CONFIG_HOME/omniroute` kapag nakatakda) - nabulok sa mga nakatutok na sub-modules: `migrations.ts`, `usageHistory.ts`, `costCalculator.ts`, `usageStats.ts`, `callLogs.ts` Domain State DB (SQLite): - `src/lib/db/domainState.ts` โ€” CRUD operations para sa domain state - Mga talahanayan (ginawa sa `src/lib/db/core.ts`): `domain_fallback_chains`, `domain_budgets`, `domain_cost_history`, `domain_lockout_state`, `domain_circuit_breakers` - Write-through na cache pattern: in-memoryang Maps ay may awtoridad sa runtime; ang mga mutasyon ay nakasulat nang sabay-sabay sa SQLite; ang estado ay naibalik mula sa DB sa malamig na simula ## 4) Auth + Security Surfaces - Dashboard cookie auth: `src/proxy.ts`, `src/app/api/auth/login/route.ts` - Pagbuo/pag-verify ng API key: `src/shared/utils/apiKey.ts` - Nagpatuloy ang mga lihim ng provider sa `providerConnections` na mga entry - Outbound proxy na suporta sa pamamagitan ng `open-sse/utils/proxyFetch.ts` (env vars) at `open-sse/utils/networkProxy.ts` (nako-configure sa bawat provider o global) ## 5) Cloud Sync - Scheduler init: `src/lib/initCloudSync.ts`, `src/shared/services/initializeCloudSync.ts` - Pana-panahong gawain: `src/shared/services/cloudSyncScheduler.ts` - Ruta ng kontrol: `src/app/api/sync/cloud/route.ts` ## Humiling ng Lifecycle (`/v1/chat/completions`) ```mermaid sequenceDiagram autonumber participant Client as CLI/SDK Client participant Route as /api/v1/chat/completions participant Chat as src/sse/handlers/chat participant Core as open-sse/handlers/chatCore participant Model as Model Resolver participant Auth as Credential Selector participant Exec as Provider Executor participant Prov as Upstream Provider participant Stream as Stream Translator participant Usage as usageDb Client->>Route: POST /v1/chat/completions Route->>Chat: handleChat(request) Chat->>Model: parse/resolve model or combo alt Combo model Chat->>Chat: iterate combo models (handleComboChat) end Chat->>Auth: getProviderCredentials(provider) Auth-->>Chat: active account + tokens/api key Chat->>Core: handleChatCore(body, modelInfo, credentials) Core->>Core: detect source format Core->>Core: translate request to target format Core->>Exec: execute(provider, transformedBody) Exec->>Prov: upstream API call Prov-->>Exec: SSE/JSON response Exec-->>Core: response + metadata alt 401/403 Core->>Exec: refreshCredentials() Exec-->>Core: updated tokens Core->>Exec: retry request end Core->>Stream: translate/normalize stream to client format Stream-->>Client: SSE chunks / JSON response Stream->>Usage: extract usage + persist history/log ``` ## Combo + Daloy ng Fallback ng Account ```mermaid flowchart TD A[Incoming model string] --> B{Is combo name?} B -- Yes --> C[Load combo models sequence] B -- No --> D[Single model path] C --> E[Try model N] E --> F[Resolve provider/model] D --> F F --> G[Select account credentials] G --> H{Credentials available?} H -- No --> I[Return provider unavailable] H -- Yes --> J[Execute request] J --> K{Success?} K -- Yes --> L[Return response] K -- No --> M{Fallback-eligible error?} M -- No --> N[Return error] M -- Yes --> O[Mark account unavailable cooldown] O --> P{Another account for provider?} P -- Yes --> G P -- No --> Q{In combo with next model?} Q -- Yes --> E Q -- No --> R[Return all unavailable] ``` Ang mga desisyon sa pagbabalik ay hinihimok ng `open-sse/services/accountFallback.ts` gamit ang mga status code at heuristic ng error-message. ## OAuth Onboarding at Token Refresh Lifecycle ```mermaid sequenceDiagram autonumber participant UI as Dashboard UI participant OAuth as /api/oauth/[provider]/[action] participant ProvAuth as Provider Auth Server participant DB as localDb participant Test as /api/providers/[id]/test participant Exec as Provider Executor UI->>OAuth: GET authorize or device-code OAuth->>ProvAuth: create auth/device flow ProvAuth-->>OAuth: auth URL or device code payload OAuth-->>UI: flow data UI->>OAuth: POST exchange or poll OAuth->>ProvAuth: token exchange/poll ProvAuth-->>OAuth: access/refresh tokens OAuth->>DB: createProviderConnection(oauth data) OAuth-->>UI: success + connection id UI->>Test: POST /api/providers/[id]/test Test->>Exec: validate credentials / optional refresh Exec-->>Test: valid or refreshed token info Test->>DB: update status/tokens/errors Test-->>UI: validation result ``` Ang pag-refresh sa panahon ng live na trapiko ay isinasagawa sa loob ng `open-sse/handlers/chatCore.ts` sa pamamagitan ng executor na `refreshCredentials()`. ## Lifecycle ng Cloud Sync (Paganahin / Pag-sync / I-disable) ```mermaid sequenceDiagram autonumber participant UI as Endpoint Page UI participant Sync as /api/sync/cloud participant DB as localDb participant Cloud as External Cloud Sync participant Claude as ~/.claude/settings.json UI->>Sync: POST action=enable Sync->>DB: set cloudEnabled=true Sync->>DB: ensure API key exists Sync->>Cloud: POST /sync/{machineId} (providers/aliases/combos/keys) Cloud-->>Sync: sync result Sync->>Cloud: GET /{machineId}/v1/verify Sync-->>UI: enabled + verification status UI->>Sync: POST action=sync Sync->>Cloud: POST /sync/{machineId} Cloud-->>Sync: remote data Sync->>DB: update newer local tokens/status Sync-->>UI: synced UI->>Sync: POST action=disable Sync->>DB: set cloudEnabled=false Sync->>Cloud: DELETE /sync/{machineId} Sync->>Claude: switch ANTHROPIC_BASE_URL back to local (if needed) Sync-->>UI: disabled ``` Ang pana-panahong pag-sync ay na-trigger ng `CloudSyncScheduler` kapag pinagana ang cloud. ## Modelo ng Data at Imbakan ng Mapa ```mermaid erDiagram SETTINGS ||--o{ PROVIDER_CONNECTION : controls PROVIDER_NODE ||--o{ PROVIDER_CONNECTION : backs_compatible_provider PROVIDER_CONNECTION ||--o{ USAGE_ENTRY : emits_usage SETTINGS { boolean cloudEnabled number stickyRoundRobinLimit boolean requireLogin string password_hash string fallbackStrategy json rateLimitDefaults json providerProfiles } PROVIDER_CONNECTION { string id string provider string authType string name number priority boolean isActive string apiKey string accessToken string refreshToken string expiresAt string testStatus string lastError string rateLimitedUntil json providerSpecificData } PROVIDER_NODE { string id string type string name string prefix string apiType string baseUrl } MODEL_ALIAS { string alias string targetModel } COMBO { string id string name string[] models } API_KEY { string id string name string key string machineId } USAGE_ENTRY { string provider string model number prompt_tokens number completion_tokens string connectionId string timestamp } CUSTOM_MODEL { string id string name string providerId } PROXY_CONFIG { string global json providers } IP_FILTER { string mode string[] allowlist string[] blocklist } THINKING_BUDGET { string mode number customBudget string effortLevel } SYSTEM_PROMPT { boolean enabled string prompt string position } ``` Mga file ng pisikal na storage: - pangunahing estado: `${DATA_DIR}/db.json` (o `$XDG_CONFIG_HOME/omniroute/db.json` kapag nakatakda, kung hindi `~/.omniroute/db.json`) - mga istatistika ng paggamit: `${DATA_DIR}/usage.json` - humiling ng mga linya ng log: `${DATA_DIR}/log.txt` - opsyonal na tagasalin/paghiling ng mga sesyon ng pag-debug: `/logs/...` ## Deployment Topology ```mermaid flowchart LR subgraph LocalHost[Developer Host] CLI[CLI Tools] Browser[Dashboard Browser] end subgraph ContainerOrProcess[OmniRoute Runtime] Next[Next.js Server\nPORT=20128] Core[SSE Core + Executors] MainDB[(db.json)] UsageDB[(usage.json/log.txt)] end subgraph External[External Services] Providers[AI Providers] SyncCloud[Cloud Sync Service] end CLI --> Next Browser --> Next Next --> Core Next --> MainDB Core --> MainDB Core --> UsageDB Core --> Providers Next --> SyncCloud ``` ## Module Mapping (Desisyon-Kritikal) ### Mga Module ng Ruta at API - `src/app/api/v1/*`, `src/app/api/v1beta/*`: mga compatibility API - `src/app/api/v1/providers/[provider]/*`: nakalaang mga ruta ng bawat provider (chat, mga pag-embed, mga larawan) - `src/app/api/providers*`: provider CRUD, pagpapatunay, pagsubok - `src/app/api/provider-nodes*`: custom na katugmang pamamahala ng node - `src/app/api/provider-models`: pamamahala ng custom na modelo (CRUD) - `src/app/api/models/catalog`: full model catalog API (lahat ng uri ay nakapangkat ayon sa provider) - `src/app/api/oauth/*`: Mga daloy ng OAuth/device-code - `src/app/api/keys*`: lokal na API key lifecycle - `src/app/api/models/alias`: pamamahala ng alias - `src/app/api/combos*`: fallback combo management - `src/app/api/pricing`: na-override ang pagpepresyo para sa pagkalkula ng gastos - `src/app/api/settings/proxy`: proxy configuration (GET/PUT/DELETE) - `src/app/api/settings/proxy/test`: outbound proxy connectivity test (POST) - `src/app/api/usage/*`: mga API sa paggamit at mga log - `src/app/api/sync/*` + `src/app/api/cloud/*`: cloud sync at cloud-facing helper - `src/app/api/cli-tools/*`: mga lokal na CLI config writers/checkers - `src/app/api/settings/ip-filter`: IP allowlist/blocklist (GET/PUT) - `src/app/api/settings/thinking-budget`: thinking token budget config (GET/PUT) - `src/app/api/settings/system-prompt`: global system prompt (GET/PUT) - `src/app/api/sessions`: aktibong listahan ng session (GET) - `src/app/api/rate-limits`: per-account rate limit status (GET) ### Routing at Execution Core - `src/sse/handlers/chat.ts`: request parse, combo handling, account selection loop - `open-sse/handlers/chatCore.ts`: pagsasalin, executor dispatch, retry/refresh handling, stream setup - `open-sse/executors/*`: network na partikular sa provider at gawi sa format ### Translation Registry at Format Converters - `open-sse/translator/index.ts`: rehistro ng tagasalin at orkestrasyon - Humiling ng mga tagasalin: `open-sse/translator/request/*` - Mga tagasalin ng tugon: `open-sse/translator/response/*` - Format constants: `open-sse/translator/formats.ts` ### Pagtitiyaga - `src/lib/localDb.ts`: paulit-ulit na config/state - `src/lib/usageDb.ts`: history ng paggamit at rolling request logs ## Saklaw ng Tagapagpatupad ng Provider (Pattern ng Diskarte) Ang bawat provider ay may dalubhasang tagapagpatupad na nagpapalawak ng `BaseExecutor` (sa `open-sse/executors/base.ts`), na nagbibigay ng pagbuo ng URL, pagbuo ng header, muling subukang may exponential backoff, mga credential refresh hook, at ang `execute()` na paraan ng orkestrasyon. | Tagapagpatupad | (Mga) Provider | Espesyal na Paghawak | | --------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------ | ----------------------------------------------------------------------------------------- | | `DefaultExecutor` | OpenAI, Claude, Gemini, Qwen, iFlow, OpenRouter, GLM, Kimi, MiniMax, DeepSeek, Groq, xAI, Mistral, Perplexity, Together, Fireworks, Cerebras, Cohere, NVIDIA | Dynamic na URL/header config bawat provider | | `AntigravityExecutor` | Google Antigravity | Mga custom na project/session ID, Retry-After parsing | | `CodexExecutor` | OpenAI Codex | Nag-inject ng mga tagubilin sa system, pinipilit ang pagsisikap sa pangangatwiran | | `CursorExecutor` | Cursor IDE | ConnectRPC protocol, Protobuf encoding, kahilingan sa pagpirma sa pamamagitan ng checksum | | `GithubExecutor` | GitHub Copilot | Copilot token refresh, VSCode-mimicking header | | `KiroExecutor` | AWS CodeWhisperer/Kiro | AWS EventStream binary format โ†’ SSE conversion | | `GeminiCLIExecutor` | Gemini CLI | Ikot ng pag-refresh ng token ng Google OAuth | Ang lahat ng iba pang provider (kabilang ang mga custom na katugmang node) ay gumagamit ng `DefaultExecutor`. ## Provider Compatibility Matrix | Provider | Format | Awth | Stream | Hindi Stream | Pag-refresh ng Token | Paggamit ng API | | ---------------- | ---------------- | --------------------- | ---------------- | ------------ | -------------------- | ----------------------------- | | Claude | claude | API Key / OAuth | โœ… | โœ… | โœ… | โš ๏ธ Admin lang | | Gemini | Gemini | API Key / OAuth | โœ… | โœ… | โœ… | โš ๏ธ Cloud Console | | Gemini CLI | Gemini-cli | OAuth | โœ… | โœ… | โœ… | โš ๏ธ Cloud Console | | Antigravity | antigravity | OAuth | โœ… | โœ… | โœ… | โœ… Buong quota API | | OpenAI | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Codex | openai-responses | OAuth | โœ… pinilit | โŒ | โœ… | โœ… Mga limitasyon sa rate | | GitHub Copilot | openai | OAuth + Copilot Token | โœ… | โœ… | โœ… | โœ… Mga snapshot ng quota | | Cursor | cursor | Custom na checksum | โœ… | โœ… | โŒ | โŒ | | Kiro | kiro | AWS SSO OIDC | โœ… (EventStream) | โŒ | โœ… | โœ… Mga limitasyon sa paggamit | | Qwen | openai | OAuth | โœ… | โœ… | โœ… | โš ๏ธ Bawat kahilingan | | iFlow | openai | OAuth (Basic) | โœ… | โœ… | โœ… | โš ๏ธ Bawat kahilingan | | OpenRouter | openai | API Key | โœ… | โœ… | โŒ | โŒ | | GLM/Kimi/MiniMax | claude | API Key | โœ… | โœ… | โŒ | โŒ | | DeepSeek | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Groq | openai | API Key | โœ… | โœ… | โŒ | โŒ | | xAI (Grok) | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Mistral | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Pagkagulo | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Magkasama AI | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Fireworks AI | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Cerebras | openai | API Key | โœ… | โœ… | โŒ | โŒ | | Cohere | openai | API Key | โœ… | โœ… | โŒ | โŒ | | NVIDIA NIM | openai | API Key | โœ… | โœ… | โŒ | โŒ | ## Sakop ng Pagsasalin ng Format Kasama sa mga natukoy na format ng pinagmulan ang: - `openai` - `openai-responses` - `claude` - `gemini` Kasama sa mga target na format ang: - OpenAI chat/Mga Tugon - Claude - Gemini/Gemini-CLI/Antigravity envelope - Kiro - Cursor Ginagamit ng mga pagsasalin ang **OpenAI bilang hub format** โ€” lahat ng conversion ay dumadaan sa OpenAI bilang intermediate: ``` Source Format โ†’ OpenAI (hub) โ†’ Target Format ``` Pinipili ang mga pagsasalin sa dynamic na paraan batay sa hugis ng source payload at format ng target ng provider. Mga karagdagang layer ng pagpoproseso sa pipeline ng pagsasalin: - **Response sanitization** โ€” Tinatanggal ang mga hindi karaniwang field mula sa OpenAI-format na mga tugon (parehong streaming at non-streaming) para matiyak ang mahigpit na pagsunod sa SDK - **Pag-normalize ng tungkulin** โ€” Kino-convert ang `developer` โ†’ `system` para sa mga target na hindi OpenAI; pinagsasama ang `system` โ†’ `user` para sa mga modelong tumatanggi sa papel ng system (GLM, ERNIE) - **Isipin ang pagkuha ng tag** โ€” Pina-parse ang `...` na mga bloke mula sa nilalaman patungo sa `reasoning_content` na field - **Structured output** โ€” Kino-convert ang OpenAI `response_format.json_schema` sa Gemini's `responseMimeType` + `responseSchema` ## Mga Sinusuportahang API Endpoints | Endpoint | Format | Handler | | -------------------------------------------------- | ------------------------- | --------------------------------------------------------------- | | `POST /v1/chat/completions` | OpenAI Chat | `src/sse/handlers/chat.ts` | | `POST /v1/messages` | Claude Messages | Parehong handler (auto-detected) | | `POST /v1/responses` | Mga Tugon sa OpenAI | `open-sse/handlers/responsesHandler.ts` | | `POST /v1/embeddings` | OpenAI Embeddings | `open-sse/handlers/embeddings.ts` | | `GET /v1/embeddings` | Listahan ng modelo | ruta ng API | | `POST /v1/images/generations` | Mga Larawan ng OpenAI | `open-sse/handlers/imageGeneration.ts` | | `GET /v1/images/generations` | Listahan ng modelo | ruta ng API | | `POST /v1/providers/{provider}/chat/completions` | OpenAI Chat | Nakatuon sa bawat provider na may pagpapatunay ng modelo | | `POST /v1/providers/{provider}/embeddings` | OpenAI Embeddings | Nakatuon sa bawat provider na may pagpapatunay ng modelo | | `POST /v1/providers/{provider}/images/generations` | Mga Larawan ng OpenAI | Nakatuon sa bawat provider na may pagpapatunay ng modelo | | `POST /v1/messages/count_tokens` | Bilang ng Token ng Claude | ruta ng API | | `GET /v1/models` | Listahan ng OpenAI Models | ruta ng API (chat + pag-embed + larawan + mga custom na modelo) | | `GET /api/models/catalog` | Catalog | Lahat ng mga modelo ay nakapangkat ayon sa provider + uri | | `POST /v1beta/models/*:streamGenerateContent` | Taong Gemini | ruta ng API | | `GET/PUT/DELETE /api/settings/proxy` | Proxy Config | Configuration ng proxy ng network | | `POST /api/settings/proxy/test` | Pagkakakonekta ng Proxy | Endpoint ng pagsubok sa kalusugan/pagkakakonekta ng proxy | | `GET/POST/DELETE /api/provider-models` | Mga Custom na Modelo | Pamamahala ng custom na modelo sa bawat provider | ## Bypass Handler Hinaharang ng bypass handler (`open-sse/utils/bypassHandler.ts`) ang mga kilalang "throwaway" na kahilingan mula kay Claude CLI โ€” mga warmup ping, pagkuha ng pamagat, at bilang ng token โ€” at nagbabalik ng **pekeng tugon** nang hindi gumagamit ng upstream na mga token ng provider. Nati-trigger lang ito kapag ang `User-Agent` ay naglalaman ng `claude-cli`. ## Humiling ng Logger Pipeline Ang request logger (`open-sse/utils/requestLogger.ts`) ay nagbibigay ng 7-stage na debug logging pipeline, na hindi pinagana bilang default, na pinagana sa pamamagitan ng `ENABLE_REQUEST_LOGS=true`: ``` 1_req_client.json โ†’ 2_req_source.json โ†’ 3_req_openai.json โ†’ 4_req_target.json โ†’ 5_res_provider.txt โ†’ 6_res_openai.txt โ†’ 7_res_client.txt ``` Ang mga file ay isinulat sa `/logs//` para sa bawat sesyon ng kahilingan. ## Mga Mode ng Pagkabigo at Katatagan ## 1) Availability ng Account/Provider - cooldown ng provider account sa mga lumilipas/rate/auth error - fallback ng account bago mabigo ang kahilingan - fallback ng combo model kapag naubos na ang kasalukuyang modelo/provider path ## 2) Pag-expire ng Token - paunang suriin at i-refresh na may muling pagsubok para sa mga nare-refresh na provider - 401/403 subukang muli pagkatapos ng pagtatangka sa pag-refresh sa pangunahing landas ## 3) Kaligtasan ng Stream - disconnect-aware stream controller - translation stream na may end-of-stream flush at `[DONE]` handling - fallback sa pagtatantya ng paggamit kapag nawawala ang metadata ng paggamit ng provider ## 4) Pagbaba ng Cloud Sync - Lumilitaw ang mga error sa pag-sync ngunit nagpapatuloy ang lokal na runtime - Ang scheduler ay may retry-capable logic, ngunit ang pana-panahong execution ay kasalukuyang tumatawag sa single-attempt sync bilang default ## 5) Integridad ng Data - Paglipat/pagkumpuni ng hugis ng DB para sa mga nawawalang key - tiwaling JSON reset safeguards para sa localDb at usageDb ## Pagmamasid at Mga Signal ng Operasyon Runtime visibility source: - mga console log mula sa `src/sse/utils/logger.ts` - mga pinagsama-samang paggamit sa bawat kahilingan sa `usage.json` - log in sa status ng text na kahilingan `log.txt` - opsyonal na malalim na kahilingan/mga log ng pagsasalin sa ilalim ng `logs/` kapag `ENABLE_REQUEST_LOGS=true` - mga endpoint sa paggamit ng dashboard (`/api/usage/*`) para sa paggamit ng UI ## Mga Hangganan na Sensitibo sa Seguridad - Sikreto ng JWT (`JWT_SECRET`) ay sinisiguro ang pag-verify/pagpirma ng cookie ng session ng dashboard - Dapat na ma-override ang paunang password (`INITIAL_PASSWORD`, default na `123456`) sa mga totoong deployment - Ang API key HMAC secret (`API_KEY_SECRET`) ay sinisiguro ang nabuong lokal na format ng API key - Ang mga lihim ng provider (mga API key/token) ay nananatili sa lokal na DB at dapat na protektahan sa antas ng filesystem - Umaasa ang mga endpoint ng cloud sync sa API key auth + semantics ng machine id ## Environment at Runtime Matrix Mga variable ng kapaligiran na aktibong ginagamit ng code: - App/auth: `JWT_SECRET`, `INITIAL_PASSWORD` - Imbakan: `DATA_DIR` - Katugmang pag-uugali ng node: `ALLOW_MULTI_CONNECTIONS_PER_COMPAT_NODE` - Opsyonal na storage base override (Linux/macOS kapag `DATA_DIR` unset): `XDG_CONFIG_HOME` - Hashing ng seguridad: `API_KEY_SECRET`, `MACHINE_ID_SALT` - Pag-log: `ENABLE_REQUEST_LOGS` - Pag-sync/cloud URLing: `NEXT_PUBLIC_BASE_URL`, `NEXT_PUBLIC_CLOUD_URL` - Papalabas na proxy: `HTTP_PROXY`, `HTTPS_PROXY`, `ALL_PROXY`, `NO_PROXY` at lowercase na mga variant - Mga flag ng tampok na SOCKS5: `ENABLE_SOCKS5_PROXY`, `NEXT_PUBLIC_ENABLE_SOCKS5_PROXY` - Mga katulong sa platform/runtime (hindi config na partikular sa app): `APPDATA`, `NODE_ENV`, `PORT`, `HOSTNAME` ## Mga Kilalang Architectural Notes 1. Ibinabahagi na ngayon ng `usageDb` at `localDb` ang parehong base directory policy (`DATA_DIR` -> `XDG_CONFIG_HOME/omniroute` -> `~/.omniroute`) na may legacy na paglipat ng file. 2. Nagbabalik ang `/api/v1/route.ts` ng static na listahan ng modelo at hindi ito ang pangunahing pinagmumulan ng mga modelo na ginagamit ng `/v1/models`. 3. Ang Request logger ay nagsusulat ng buong header/body kapag pinagana; ituring ang direktoryo ng log bilang sensitibo. 4. Ang pag-uugali ng cloud ay nakasalalay sa tamang `NEXT_PUBLIC_BASE_URL` at maabot ang endpoint ng cloud. 5. Ang `open-sse/` na direktoryo ay na-publish bilang ang `@omniroute/open-sse` **npm workspace package**. Ini-import ito ng source code sa pamamagitan ng `@omniroute/open-sse/...` (nalutas ng Next.js `transpilePackages`). Ginagamit pa rin ng mga file path sa dokumentong ito ang pangalan ng direktoryo na `open-sse/` para sa pagkakapare-pareho. 6. Ang mga chart sa dashboard ay gumagamit ng **Recharts** (SVG-based) para sa naa-access, interactive na mga visualization ng analytics (mga bar chart ng paggamit ng modelo, mga talahanayan ng breakdown ng provider na may mga rate ng tagumpay). 7. Ang mga pagsusulit sa E2E ay gumagamit ng **Playwright** (`tests/e2e/`), tumatakbo sa pamamagitan ng `npm run test:e2e`. Gumagamit ang mga unit test ng **Node.js test runner** (`tests/unit/`), na tumatakbo sa pamamagitan ng `npm run test:plan3`. Ang source code sa ilalim ng `src/` ay **TypeScript** (`.ts`/`.tsx`); ang `open-sse/` workspace ay nananatiling JavaScript (`.js`). 8. Ang pahina ng mga setting ay isinaayos sa 5 tab: Seguridad, Pagruruta (6 na pandaigdigang diskarte: fill-first, round-robin, p2c, random, hindi gaanong ginagamit, cost-optimized), Resilience (editable rate limits, circuit breaker, mga patakaran), AI (thinking budget, system prompt, prompt cache), Advanced (proxy). ## Checklist ng Pagpapatunay ng Operasyon - Bumuo mula sa pinagmulan: `npm run build` - Bumuo ng larawan ng Docker: `docker build -t omniroute .` - Simulan ang serbisyo at i-verify: - `GET /api/settings` - `GET /api/v1/models` - Ang CLI target base URL ay dapat na `http://:20128/v1` kapag `PORT=20128`