# omniroute — Kodbasdokumentation 🌐 **Languages:** đŸ‡ș🇾 [English](../../CODEBASE_DOCUMENTATION.md) | đŸ‡§đŸ‡· [PortuguĂȘs (Brasil)](../pt-BR/CODEBASE_DOCUMENTATION.md) | đŸ‡Ș🇾 [Español](../es/CODEBASE_DOCUMENTATION.md) | đŸ‡«đŸ‡· [Français](../fr/CODEBASE_DOCUMENTATION.md) | 🇼đŸ‡č [Italiano](../it/CODEBASE_DOCUMENTATION.md) | đŸ‡·đŸ‡ș [РуссĐșĐžĐč](../ru/CODEBASE_DOCUMENTATION.md) | 🇹🇳 [äž­æ–‡ (çź€äœ“)](../zh-CN/CODEBASE_DOCUMENTATION.md) | đŸ‡©đŸ‡Ș [Deutsch](../de/CODEBASE_DOCUMENTATION.md) | 🇼🇳 [à€čà€żà€šà„à€Šà„€](../in/CODEBASE_DOCUMENTATION.md) | đŸ‡č🇭 [àč„àž—àžą](../th/CODEBASE_DOCUMENTATION.md) | đŸ‡ș🇩 [ĐŁĐșŃ€Đ°Ń—ĐœŃŃŒĐșа](../uk-UA/CODEBASE_DOCUMENTATION.md) | 🇾🇩 [Ű§Ù„ŰčŰ±ŰšÙŠŰ©](../ar/CODEBASE_DOCUMENTATION.md) | đŸ‡ŻđŸ‡” [æ—„æœŹèȘž](../ja/CODEBASE_DOCUMENTATION.md) | đŸ‡»đŸ‡ł [Tiáșżng Việt](../vi/CODEBASE_DOCUMENTATION.md) | 🇧🇬 [БългарсĐșĐž](../bg/CODEBASE_DOCUMENTATION.md) | đŸ‡©đŸ‡° [Dansk](../da/CODEBASE_DOCUMENTATION.md) | đŸ‡«đŸ‡ź [Suomi](../fi/CODEBASE_DOCUMENTATION.md) | đŸ‡źđŸ‡± [ŚąŚ‘ŚšŚ™ŚȘ](../he/CODEBASE_DOCUMENTATION.md) | 🇭đŸ‡ș [Magyar](../hu/CODEBASE_DOCUMENTATION.md) | đŸ‡źđŸ‡© [Bahasa Indonesia](../id/CODEBASE_DOCUMENTATION.md) | đŸ‡°đŸ‡· [한ꔭ얎](../ko/CODEBASE_DOCUMENTATION.md) | đŸ‡ČđŸ‡Ÿ [Bahasa Melayu](../ms/CODEBASE_DOCUMENTATION.md) | đŸ‡łđŸ‡± [Nederlands](../nl/CODEBASE_DOCUMENTATION.md) | 🇳🇮 [Norsk](../no/CODEBASE_DOCUMENTATION.md) | đŸ‡”đŸ‡č [PortuguĂȘs (Portugal)](../pt/CODEBASE_DOCUMENTATION.md) | đŸ‡·đŸ‡Ž [RomĂąnă](../ro/CODEBASE_DOCUMENTATION.md) | đŸ‡”đŸ‡± [Polski](../pl/CODEBASE_DOCUMENTATION.md) | 🇾🇰 [Slovenčina](../sk/CODEBASE_DOCUMENTATION.md) | 🇾đŸ‡Ș [Svenska](../sv/CODEBASE_DOCUMENTATION.md) | đŸ‡”đŸ‡­ [Filipino](../phi/CODEBASE_DOCUMENTATION.md) > En omfattande, nybörjarvĂ€nlig guide till **omniroute** AI-proxyrouter med flera leverantörer. --- ## 1. Vad Ă€r omniroute? omniroute Ă€r en **proxyrouter** som sitter mellan AI-klienter (Claude CLI, Codex, Cursor IDE, etc.) och AI-leverantörer (Anthropic, Google, OpenAI, AWS, GitHub, etc.). Det löser ett stort problem: > **Olika AI-klienter talar olika "sprĂ„k" (API-format), och olika AI-leverantörer förvĂ€ntar sig ocksĂ„ olika "sprĂ„k".** omniroute översĂ€tter mellan dem automatiskt. TĂ€nk pĂ„ det som en universell översĂ€ttare vid Förenta Nationerna - vilken delegat som helst kan tala vilket sprĂ„k som helst, och översĂ€ttaren konverterar det till vilken annan delegat som helst. --- ## 2. Arkitekturöversikt ```mermaid graph LR subgraph Clients A[Claude CLI] B[Codex] C[Cursor IDE] D[OpenAI-compatible] end subgraph omniroute E[Handler Layer] F[Translator Layer] G[Executor Layer] H[Services Layer] end subgraph Providers I[Anthropic Claude] J[Google Gemini] K[OpenAI / Codex] L[GitHub Copilot] M[AWS Kiro] N[Antigravity] O[Cursor API] end A --> E B --> E C --> E D --> E E --> F F --> G G --> I G --> J G --> K G --> L G --> M G --> N G --> O H -.-> E H -.-> G ``` ### KĂ€rnprincip: ÖversĂ€ttning av nav och eker All formatöversĂ€ttning gĂ„r genom **OpenAI-formatet som navet**: ``` Client Format → [OpenAI Hub] → Provider Format (request) Provider Format → [OpenAI Hub] → Client Format (response) ``` Det betyder att du bara behöver **N översĂ€ttare** (en per format) istĂ€llet för **NÂČ** (varje par). --- ## 3. Projektets struktur ``` omniroute/ ├── open-sse/ ← Core proxy library (portable, framework-agnostic) │ ├── index.js ← Main entry point, exports everything │ ├── config/ ← Configuration & constants │ ├── executors/ ← Provider-specific request execution │ ├── handlers/ ← Request handling orchestration │ ├── services/ ← Business logic (auth, models, fallback, usage) │ ├── translator/ ← Format translation engine │ │ ├── request/ ← Request translators (8 files) │ │ ├── response/ ← Response translators (7 files) │ │ └── helpers/ ← Shared translation utilities (6 files) │ └── utils/ ← Utility functions ├── src/ ← Application layer (Express/Worker runtime) │ ├── app/ ← Web UI, API routes, middleware │ ├── lib/ ← Database, auth, and shared library code │ ├── mitm/ ← Man-in-the-middle proxy utilities │ ├── models/ ← Database models │ ├── shared/ ← Shared utilities (wrappers around open-sse) │ ├── sse/ ← SSE endpoint handlers │ └── store/ ← State management ├── data/ ← Runtime data (credentials, logs) │ └── provider-credentials.json (external credentials override, gitignored) └── tester/ ← Test utilities ``` --- ## 4. Uppdelning av modul för modul ### 4.1 Config (`open-sse/config/`) Den **enda kĂ€llan till sanning** för alla leverantörskonfigurationer. | Arkiv | Syfte | | ----------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | `constants.ts` | `PROVIDERS` objekt med bas-URL:er, OAuth-referenser (standard), rubriker och standardsystemuppmaningar för varje leverantör. Definierar Ă€ven `HTTP_STATUS`, `ERROR_TYPES`, `COOLDOWN_MS`, `BACKOFF_CONFIG` och `SKIP_PATTERNS`. | | `credentialLoader.ts` | Laddar externa referenser frĂ„n `data/provider-credentials.json` och slĂ„r samman dem över de hĂ„rdkodade standardinstĂ€llningarna i `PROVIDERS`. HĂ„ller hemligheter utom kĂ€llans kontroll samtidigt som bakĂ„tkompatibiliteten bibehĂ„lls. | | `providerModels.ts` | Centralt modellregister: kartleverantörsalias → modell-ID:n. Funktioner som `getModels()`, `getProviderByAlias()`. | | `codexInstructions.ts` | Systeminstruktioner injicerade i Codex-förfrĂ„gningar (redigeringsbegrĂ€nsningar, sandlĂ„deregler, godkĂ€nnandepolicyer). | | `defaultThinkingSignature.ts` | Standard "tĂ€nkande" signaturer för Claude och Gemini modeller. | | `ollamaModels.ts` | Schemadefinition för lokala Ollama-modeller (namn, storlek, familj, kvantisering). | #### Behörighetsladdningsflöde ```mermaid flowchart TD A["App starts"] --> B["constants.ts defines PROVIDERS\nwith hardcoded defaults"] B --> C{"data/provider-credentials.json\nexists?"} C -->|Yes| D["credentialLoader reads JSON"] C -->|No| E["Use hardcoded defaults"] D --> F{"For each provider in JSON"} F --> G{"Provider exists\nin PROVIDERS?"} G -->|No| H["Log warning, skip"] G -->|Yes| I{"Value is object?"} I -->|No| J["Log warning, skip"] I -->|Yes| K["Merge clientId, clientSecret,\ntokenUrl, authUrl, refreshUrl"] K --> F H --> F J --> F F -->|Done| L["PROVIDERS ready with\nmerged credentials"] E --> L ``` --- ### 4.2 Exekutorer (`open-sse/executors/`) Exekutorer kapslar in **leverantörsspecifik logik** med hjĂ€lp av **Strategy Pattern**. Varje executor Ă„sidosĂ€tter basmetoder efter behov. ```mermaid classDiagram class BaseExecutor { +buildUrl(model, stream, options) +buildHeaders(credentials, stream, body) +transformRequest(body, model, stream, credentials) +execute(url, options) +shouldRetry(status, error) +refreshCredentials(credentials, log) } class DefaultExecutor { +refreshCredentials() } class AntigravityExecutor { +buildUrl() +buildHeaders() +transformRequest() +shouldRetry() +refreshCredentials() } class CursorExecutor { +buildUrl() +buildHeaders() +transformRequest() +parseResponse() +generateChecksum() } class KiroExecutor { +buildUrl() +buildHeaders() +transformRequest() +parseEventStream() +refreshCredentials() } BaseExecutor <|-- DefaultExecutor BaseExecutor <|-- AntigravityExecutor BaseExecutor <|-- CursorExecutor BaseExecutor <|-- KiroExecutor BaseExecutor <|-- CodexExecutor BaseExecutor <|-- GeminiCLIExecutor BaseExecutor <|-- GithubExecutor ``` | Exekutor | Leverantör | Nyckelspecialiseringar | | ---------------- | ------------------------------------------ | ----------------------------------------------------------------------------------------------------------------------------------------------------- | | `base.ts` | — | Abstrakt bas: URL-byggnad, rubriker, logik för försök igen, uppdatering av autentiseringsuppgifter | | `default.ts` | Claude, Gemini, OpenAI, GLM, Kimi, MiniMax | Generisk OAuth-tokenuppdatering för standardleverantörer | | `antigravity.ts` | Google Cloud Code | Generering av projekt-/sessions-ID, reserv för flera webbadresser, anpassad försök att analysera igen frĂ„n felmeddelanden ("Ă„terstĂ€ll efter 2h7m23s") | | `cursor.ts` | Markör IDE | **Mest komplex**: SHA-256 kontrollsummaauth, Protobuf-begĂ€rankodning, binĂ€r EventStream → SSE-svarsanalys | | `codex.ts` | OpenAI Codex | Injicerar systeminstruktioner, hanterar tankenivĂ„er, tar bort parametrar som inte stöds | | `gemini-cli.ts` | Google Gemini CLI | Byggande av anpassad webbadress (`streamGenerateContent`), uppdatering av Google OAuth-token | | `github.ts` | GitHub Copilot | Dubbla tokensystem (GitHub OAuth + Copilot-token), VSCode-huvudhĂ€rmare | | `kiro.ts` | AWS CodeWhisperer | AWS EventStream binĂ€r analys, AMZN-hĂ€ndelseramar, tokenuppskattning | | `index.ts` | — | Fabrik: maps provider name → executor class, with default fallback | --- ### 4.3 Hanterare (`open-sse/handlers/`) **orkestreringsskiktet** — koordinerar översĂ€ttning, exekvering, streaming och felhantering. | Arkiv | Syfte | | --------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | `chatCore.ts` | **Centralorkester** (~600 rader). Hanterar hela begĂ€rans livscykel: formatdetektering → översĂ€ttning → exekutorutskick → strömmande/icke-strömmande svar → tokenuppdatering → felhantering → anvĂ€ndningsloggning. | | `responsesHandler.ts` | Adapter för OpenAI:s Responses API: konverterar svarsformat → Chattavslut → skickar till `chatCore` → konverterar SSE tillbaka till svarsformat. | | `embeddings.ts` | InbĂ€ddningsgenereringshanterare: löser inbĂ€ddningsmodell → leverantör, skickar till leverantörs API, returnerar OpenAI-kompatibelt inbĂ€ddningssvar. Stöder 6+ leverantörer. | | `imageGeneration.ts` | Bildgenereringshanterare: löser bildmodell → leverantör, stöder OpenAI-kompatibla, Gemini-bild (Antigravity) och reservlĂ€ge (Nebius). Returnerar base64- eller URL-bilder. | #### BegĂ€r livscykel (chatCore.ts) ```mermaid sequenceDiagram participant Client participant chatCore participant Translator participant Executor participant Provider Client->>chatCore: Request (any format) chatCore->>chatCore: Detect source format chatCore->>chatCore: Check bypass patterns chatCore->>chatCore: Resolve model & provider chatCore->>Translator: Translate request (source → OpenAI → target) chatCore->>Executor: Get executor for provider Executor->>Executor: Build URL, headers, transform request Executor->>Executor: Refresh credentials if needed Executor->>Provider: HTTP fetch (streaming or non-streaming) alt Streaming Provider-->>chatCore: SSE stream chatCore->>chatCore: Pipe through SSE transform stream Note over chatCore: Transform stream translates
each chunk: target → OpenAI → source chatCore-->>Client: Translated SSE stream else Non-streaming Provider-->>chatCore: JSON response chatCore->>Translator: Translate response chatCore-->>Client: Translated JSON end alt Error (401, 429, 500...) chatCore->>Executor: Retry with credential refresh chatCore->>chatCore: Account fallback logic end ``` --- ### 4.4 TjĂ€nster (`open-sse/services/`) AffĂ€rslogik som stödjer hanterarna och utförarna. | Arkiv | Syfte | | -------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ | | `provider.ts` | **Formatdetektering** (`detectFormat`): analyserar begĂ€ran om kroppsstruktur för att identifiera Claude/OpenAI/Gemini/Antigravity/Responses-format (inkluderar `max_tokens` heuristik för Claude). Dessutom: URL-byggande, header-byggande, normalisering av tankekonfiguration. Stöder `openai-compatible-*` och `anthropic-compatible-*` dynamiska leverantörer. | | `model.ts` | ModellstrĂ€ngsanalys (`claude/model-name` → `{provider: "claude", model: "model-name"}`), aliasupplösning med kollisionsdetektering, ingĂ„ngssanering (avvisar vĂ€gövergĂ„ng/kontrolltecken) och modellinformationsupplösning med stöd för asynkront alias getter. | | `accountFallback.ts` | Hantering av hastighetsgrĂ€nser: exponentiell backoff (1s → 2s → 4s → max 2min), hantering av kontonedkylning, felklassificering (vilka fel utlöser fallback kontra inte). | | `tokenRefresh.ts` | OAuth-tokenuppdatering för **alla leverantörer**: Google (Gemini, Antigravity), Claude, Codex, Qwen, iFlow, GitHub (OAuth + Copilot dual-token), Kiro (AWS SSO OIDC + Social Auth). Inkluderar löftesdedupliceringscache under flygning och försök igen med exponentiell backoff. | | `combo.ts` | **Kombomodeller**: kedjor av reservmodeller. Om modell A misslyckas med ett fallback-berĂ€ttigat fel, prova modell B, sedan C osv. Returnerar faktiska uppströmsstatuskoder. | | `usage.ts` | HĂ€mtar kvot/anvĂ€ndningsdata frĂ„n leverantörens API:er (GitHub Copilot-kvoter, Antigravity-modellkvoter, Codex-hastighetsgrĂ€nser, Kiro-anvĂ€ndningsuppdelningar, Claude-instĂ€llningar). | | `accountSelector.ts` | Smart kontoval med poĂ€ngalgoritm: tar hĂ€nsyn till prioritet, hĂ€lsostatus, round-robin-position och nedkylningslĂ€ge för att vĂ€lja det optimala kontot för varje begĂ€ran. | | `contextManager.ts` | BegĂ€r kontext livscykelhantering: skapar och spĂ„rar per begĂ€ran kontextobjekt med metadata (begĂ€ran ID, tidsstĂ€mplar, leverantörsinformation) för felsökning och loggning. | | `ipFilter.ts` | IP-baserad Ă„tkomstkontroll: stöder tillstĂ„nds- och blockeringslĂ€gen. Validerar klient-IP mot konfigurerade regler innan API-förfrĂ„gningar behandlas. | | `sessionManager.ts` | SessionsspĂ„rning med klientfingeravtryck: spĂ„rar aktiva sessioner med hashade klientidentifierare, övervakar antalet begĂ€randen och tillhandahĂ„ller sessionsstatistik. | | `signatureCache.ts` | BegĂ€r signaturbaserad dedupliceringscache: förhindrar dubbletter av begĂ€randen genom att cachelagra senaste begĂ€ransignaturer och returnera cachade svar för identiska förfrĂ„gningar inom ett tidsfönster. | | `systemPrompt.ts` | Global systempromptinjektion: lĂ€gger till eller lĂ€gger till en konfigurerbar systemprompt till alla förfrĂ„gningar, med kompatibilitetshantering per leverantör. | | `thinkingBudget.ts` | Hantering av resonerande tokenbudget: stöder passthrough, auto (strip thinking config), anpassade (fast budget) och adaptiva (komplexitetsskalade) lĂ€gen för att kontrollera tĂ€nkande/resonemangstokens. | | `wildcardRouter.ts` | Jokerteckenmodellmönsterrouting: löser jokerteckenmönster (t.ex. `*/claude-*`) till konkreta leverantör/modellpar baserat pĂ„ tillgĂ€nglighet och prioritet. | #### Token Refresh Deduplication ```mermaid sequenceDiagram participant R1 as Request 1 participant R2 as Request 2 participant Cache as refreshPromiseCache participant OAuth as OAuth Provider R1->>Cache: getAccessToken("gemini", token) Cache->>Cache: No in-flight promise Cache->>OAuth: Start refresh R2->>Cache: getAccessToken("gemini", token) Cache->>Cache: Found in-flight promise Cache-->>R2: Return existing promise OAuth-->>Cache: New access token Cache-->>R1: New access token Cache-->>R2: Same access token (shared) Cache->>Cache: Delete cache entry ``` #### Konto reservtillstĂ„ndsmaskin ```mermaid stateDiagram-v2 [*] --> Active Active --> Error: Request fails (401/429/500) Error --> Cooldown: Apply backoff Cooldown --> Active: Cooldown expires Active --> Active: Request succeeds (reset backoff) state Error { [*] --> ClassifyError ClassifyError --> ShouldFallback: Rate limit / Auth / Transient ClassifyError --> NoFallback: 400 Bad Request } state Cooldown { [*] --> ExponentialBackoff ExponentialBackoff: Level 0 = 1s ExponentialBackoff: Level 1 = 2s ExponentialBackoff: Level 2 = 4s ExponentialBackoff: Max = 2min } ``` #### Kombinerad modellkedja ```mermaid flowchart LR A["Request with\ncombo model"] --> B["Model A"] B -->|"2xx Success"| C["Return response"] B -->|"429/401/500"| D{"Fallback\neligible?"} D -->|Yes| E["Model B"] D -->|No| F["Return error"] E -->|"2xx Success"| C E -->|"429/401/500"| G{"Fallback\neligible?"} G -->|Yes| H["Model C"] G -->|No| F H -->|"2xx Success"| C H -->|"Fail"| I["All failed →\nReturn last status"] ``` --- ### 4.5 ÖversĂ€ttare (`open-sse/translator/`) **formatöversĂ€ttningsmotorn** anvĂ€nder ett sjĂ€lvregistrerande pluginsystem. #### Arkitektur ```mermaid graph TD subgraph "Request Translation" A["Claude → OpenAI"] B["Gemini → OpenAI"] C["Antigravity → OpenAI"] D["OpenAI Responses → OpenAI"] E["OpenAI → Claude"] F["OpenAI → Gemini"] G["OpenAI → Kiro"] H["OpenAI → Cursor"] end subgraph "Response Translation" I["Claude → OpenAI"] J["Gemini → OpenAI"] K["Kiro → OpenAI"] L["Cursor → OpenAI"] M["OpenAI → Claude"] N["OpenAI → Antigravity"] O["OpenAI → Responses"] end ``` | Katalog | Filer | Beskrivning | | ------------ | ------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | `request/` | 8 översĂ€ttare | Konvertera begĂ€randekroppar mellan format. Varje fil sjĂ€lvregistreras via `register(from, to, fn)` vid import. | | `response/` | 7 översĂ€ttare | Konvertera strömmande svarsbitar mellan format. Hanterar SSE-hĂ€ndelsetyper, tankeblock, verktygsanrop. | | `helpers/` | 6 hjĂ€lpare | Delade verktyg: `claudeHelper` (extrahering av systemprompt, tankekonfiguration), `geminiHelper` (mappning av delar/innehĂ„ll), `openaiHelper` (formatfiltrering), `toolCallHelper` (ID-generering, injektion av saknat svar), `maxTokensHelper`, `responsesApiHelper`. | | `index.ts` | — | ÖversĂ€ttningsmotor: `translateRequest()`, `translateResponse()`, statlig ledning, register. | | `formats.ts` | — | Formatkonstanter: `OPENAI`, `CLAUDE`, `GEMINI`, `ANTIGRAVITY`, `KIRO`, `CURSOR`, `OPENAI_RESPONSES`. | #### Nyckeldesign: SjĂ€lvregistrerande plugins ```javascript // Each translator file calls register() on import: import { register } from "../index.js"; register("claude", "openai", translateClaudeToOpenAI); // The index.js imports all translator files, triggering registration: import "./request/claude-to-openai.js"; // ← self-registers ``` --- ### 4.6 Utils (`open-sse/utils/`) | Arkiv | Syfte | | ------------------ | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ | | `error.ts` | Byggande av felsvar (OpenAI-kompatibelt format), uppströms felanalys, Antigravity-Ă„terförsöksextraktion frĂ„n felmeddelanden, SSE-felströmning. | | `stream.ts` | **SSE Transform Stream** — kĂ€rnan för streaming. TvĂ„ lĂ€gen: `TRANSLATE` (översĂ€ttning i fullformat) och `PASSTHROUGH` (normalisera + extrahera anvĂ€ndning). Hanterar chunkbuffring, anvĂ€ndningsuppskattning, spĂ„rning av innehĂ„llslĂ€ngd. Encoder/decoder-instanser per ström undviker delat tillstĂ„nd. | | `streamHelpers.ts` | SSE-verktyg pĂ„ lĂ„g nivĂ„: `parseSSELine` (tolerant för blanksteg), `hasValuableContent` (filtrerar tomma bitar för OpenAI/Claude/Gemini), `fixInvalidId`, `formatSSE` (formatmedveten SSE-serialisering med med ). | | `usageTracking.ts` | Extrahering av tokenanvĂ€ndning frĂ„n valfritt format (Claude/OpenAI/Gemini/Responses), uppskattning med separata verktyg/meddelande-char-per-token-förhĂ„llanden, bufferttillĂ€gg (sĂ€kerhetsmarginal för 2000 tokens), formatspecifik fĂ€ltfiltrering, konsolloggning med ANSI-fĂ€rger. | | `requestLogger.ts` | Filbaserad förfrĂ„gningsloggning (opt-in via `ENABLE_REQUEST_LOGS=true`). Skapar sessionsmappar med numrerade filer: `1_req_client.json` → `7_res_client.txt`. All I/O Ă€r asynkron (eld-och-glöm). Maskerar kĂ€nsliga rubriker. | | `bypassHandler.ts` | FĂ„ngar upp specifika mönster frĂ„n Claude CLI (titelextraktion, uppvĂ€rmning, rĂ€kning) och returnerar falska svar utan att ringa nĂ„gon leverantör. Stöder bĂ„de streaming och icke-streaming. Avsiktligt begrĂ€nsad till Claude CLI omfattning. | | `networkProxy.ts` | Löser utgĂ„ende proxy-URL för en given leverantör med prioritet: leverantörsspecifik konfiguration → global konfiguration → miljövariabler (`HTTPS_PROXY`/`HTTP_PROXY`/`ALL_PROXY`). Stöder `NO_PROXY` undantag. Caches konfiguration för 30s. | #### SSE Streaming Pipeline ```mermaid flowchart TD A["Provider SSE stream"] --> B["TextDecoder\n(per-stream instance)"] B --> C["Buffer lines\n(split on newline)"] C --> D["parseSSELine()\n(trim whitespace, parse JSON)"] D --> E{"Mode?"} E -->|TRANSLATE| F["translateResponse()\ntarget → OpenAI → source"] E -->|PASSTHROUGH| G["fixInvalidId()\nnormalize chunk"] F --> H["hasValuableContent()\nfilter empty chunks"] G --> H H -->|"Has content"| I["extractUsage()\ntrack token counts"] H -->|"Empty"| J["Skip chunk"] I --> K["formatSSE()\nserialize + clean perf_metrics"] K --> L["TextEncoder\n(per-stream instance)"] L --> M["Enqueue to\nclient stream"] style A fill:#f9f,stroke:#333 style M fill:#9f9,stroke:#333 ``` #### BegĂ€r Logger Session Struktur ``` logs/ └── claude_gemini_claude-sonnet_20260208_143045/ ├── 1_req_client.json ← Raw client request ├── 2_req_source.json ← After initial conversion ├── 3_req_openai.json ← OpenAI intermediate format ├── 4_req_target.json ← Final target format ├── 5_res_provider.txt ← Provider SSE chunks (streaming) ├── 5_res_provider.json ← Provider response (non-streaming) ├── 6_res_openai.txt ← OpenAI intermediate chunks ├── 7_res_client.txt ← Client-facing SSE chunks └── 6_error.json ← Error details (if any) ``` --- ### 4.7 Application Layer (`src/`) | Katalog | Syfte | | ------------- | -------------------------------------------------------------------------------------- | | `src/app/` | WebbgrĂ€nssnitt, API-rutter, Express-mellanprogramvara, OAuth-Ă„teruppringningshanterare | | `src/lib/` | DatabasĂ„tkomst (`localDb.ts`, `usageDb.ts`), autentisering, delad | | `src/mitm/` | Man-in-the-middle-proxyverktyg för att avlyssna leverantörstrafik | | `src/models/` | Databasmodelldefinitioner | | `src/shared/` | Omslag runt öppna-sse-funktioner (leverantör, stream, fel, etc.) | | `src/sse/` | SSE-slutpunktshanterare som kopplar open-sse-biblioteket till Express-rutter | | `src/store/` | TillstĂ„ndshantering för applikationer | #### AnmĂ€rkningsvĂ€rda API-rutter | Rutt | Metoder | Syfte | | --------------------------------------------- | ---------------- | ----------------------------------------------------------------------------------------------------- | | `/api/provider-models` | GET/POSTA/RADERA | CRUD för anpassade modeller per leverantör | | `/api/models/catalog` | FÅ | Aggregerad katalog över alla modeller (chatt, inbĂ€ddning, bild, anpassad) grupperade efter leverantör | | `/api/settings/proxy` | GET/PUT/DELETE | Hierarkisk utgĂ„ende proxykonfiguration (`global/providers/combos/keys`) | | `/api/settings/proxy/test` | POST | Validerar proxyanslutning och returnerar offentlig IP/latency | | `/v1/providers/[provider]/chat/completions` | POST | Dedikerade chattkompletteringar per leverantör med modellvalidering | | `/v1/providers/[provider]/embeddings` | POST | Dedikerade inbĂ€ddningar per leverantör med modellvalidering | | `/v1/providers/[provider]/images/generations` | POST | Dedikerad bildgenerering per leverantör med modellvalidering | | `/api/settings/ip-filter` | GET/PUT | Hantering av IP-tillstĂ„ndslistor/blockeringslistor | | `/api/settings/thinking-budget` | GET/PUT | Resonemangstokens budgetkonfiguration (passthrough/auto/custom/adaptive) | | `/api/settings/system-prompt` | GET/PUT | Global systeminjektion för alla förfrĂ„gningar | | `/api/sessions` | FÅ | Aktiv sessionsspĂ„rning och mĂ€tvĂ€rden | | `/api/rate-limits` | FÅ | RĂ€ntegrĂ€nsstatus per konto | --- ## 5. Nyckeldesignmönster ### 5.1 Hub-and-Speake-översĂ€ttning Alla format översĂ€tts genom **OpenAI-formatet som navet**. Att lĂ€gga till en ny leverantör krĂ€ver bara att man skriver **ett par** översĂ€ttare (till/frĂ„n OpenAI), inte N par. ### 5.2 Exekutorstrategimönster Varje leverantör har en dedikerad executor-klass som Ă€rver frĂ„n `BaseExecutor`. Fabriken i `executors/index.ts` vĂ€ljer rĂ€tt vid körning. ### 5.3 SjĂ€lvregistrerande pluginsystem ÖversĂ€ttningsmoduler registrerar sig sjĂ€lva vid import via `register()`. Att lĂ€gga till en ny översĂ€ttare Ă€r bara att skapa en fil och importera den. ### 5.4 KontoĂ„tgĂ„ng med exponentiell backoff NĂ€r en leverantör returnerar 429/401/500 kan systemet byta till nĂ€sta konto genom att tillĂ€mpa exponentiell nedkylning (1s → 2s → 4s → max 2min). ### 5.5 Combo modellkedjor En "combo" grupperar flera `provider/model`-strĂ€ngar. Om den första misslyckas, Ă„tergĂ„ automatiskt till nĂ€sta. ### 5.6 Stateful Streaming Translation SvarsöversĂ€ttning upprĂ€tthĂ„ller tillstĂ„nd över SSE-bitar (tĂ€nkeblockspĂ„rning, verktygsanropsackumulering, innehĂ„llsblockindexering) via mekanismen `initState()`. ### 5.7 AnvĂ€ndningssĂ€kerhetsbuffert En buffert pĂ„ 2000 token lĂ€ggs till rapporterad anvĂ€ndning för att förhindra att klienter nĂ„r kontextfönstergrĂ€nser pĂ„ grund av overhead frĂ„n systemuppmaningar och formatöversĂ€ttning. --- ## 6. Format som stöds | Format | Riktning | Identifierare | | --------------------- | ----------- | ------------------ | | OpenAI Chat Slutförda | kĂ€lla + mĂ„l | `openai` | | OpenAI Responses API | kĂ€lla + mĂ„l | `openai-responses` | | Antropisk Claude | kĂ€lla + mĂ„l | `claude` | | Google Tvillingarna | kĂ€lla + mĂ„l | `gemini` | | Google Gemini CLI | endast mĂ„l | `gemini-cli` | | Antigravitation | kĂ€lla + mĂ„l | `antigravity` | | AWS Kiro | endast mĂ„l | `kiro` | | Markör | endast mĂ„l | `cursor` | --- ## 7. Leverantörer som stöds | Leverantör | Auth Method | Exekutor | Viktiga anmĂ€rkningar | | ------------------------ | ------------------------------ | --------------- | --------------------------------------------------------------------- | | Antropisk Claude | API-nyckel eller OAuth | Standard | AnvĂ€nder `x-api-key` header | | Google Tvillingarna | API-nyckel eller OAuth | Standard | AnvĂ€nder `x-goog-api-key` header | | Google Gemini CLI | OAuth | GeminiCLI | AnvĂ€nder `streamGenerateContent` slutpunkt | | Antigravitation | OAuth | Antigravitation | Alternativ för flera webbadresser, anpassad försök att analysera igen | | OpenAI | API-nyckel | Standard | StandardbĂ€rare auth | | Codex | OAuth | Codex | Injicerar systeminstruktioner, hanterar tĂ€nkande | | GitHub Copilot | OAuth + Copilot-token | Github | Dubbla token, VSCode-huvudhĂ€rmar | | Kiro (AWS) | AWS SSO OIDC eller Social | Kiro | BinĂ€r EventStream-analys | | Markör IDE | Kontrollsumma auth | Markör | Protobuf-kodning, SHA-256 kontrollsummor | | Qwen | OAuth | Standard | Standardauth | | iFlow | OAuth (GrundlĂ€ggande + BĂ€rare) | Standard | Dubbla autentiseringshuvud | | OpenRouter | API-nyckel | Standard | StandardbĂ€rare auth | | GLM, Kimi, MiniMax | API-nyckel | Standard | Claude-kompatibel, anvĂ€nd `x-api-key` | | `openai-compatible-*` | API-nyckel | Standard | Dynamisk: alla OpenAI-kompatibla slutpunkter | | `anthropic-compatible-*` | API-nyckel | Standard | Dynamisk: valfri Claude-kompatibel slutpunkt | --- ## 8. Dataflödessammanfattning ### StrömningsförfrĂ„gan ```mermaid flowchart LR A["Client"] --> B["detectFormat()"] B --> C["translateRequest()\nsource → OpenAI → target"] C --> D["Executor\nbuildUrl + buildHeaders"] D --> E["fetch(providerURL)"] E --> F["createSSEStream()\nTRANSLATE mode"] F --> G["parseSSELine()"] G --> H["translateResponse()\ntarget → OpenAI → source"] H --> I["extractUsage()\n+ addBuffer"] I --> J["formatSSE()"] J --> K["Client receives\ntranslated SSE"] K --> L["logUsage()\nsaveRequestUsage()"] ``` ### BegĂ€ran om icke-streaming ```mermaid flowchart LR A["Client"] --> B["detectFormat()"] B --> C["translateRequest()\nsource → OpenAI → target"] C --> D["Executor.execute()"] D --> E["translateResponse()\ntarget → OpenAI → source"] E --> F["Return JSON\nresponse"] ``` ### Bypass Flow (Claude CLI) ```mermaid flowchart LR A["Claude CLI request"] --> B{"Match bypass\npattern?"} B -->|"Title/Warmup/Count"| C["Generate fake\nOpenAI response"] B -->|"No match"| D["Normal flow"] C --> E["Translate to\nsource format"] E --> F["Return without\ncalling provider"] ```