OmniRoute/docs/i18n/no/CODEBASE_DOCUMENTATION.md
diegosouzapw 1647005d6e docs(i18n): add multilingual documentation translations
Add translated documentation files for multiple languages including
Korean, Polish, and others under docs/i18n/. Translations cover
API reference, quickstart guides, and project documentation to
improve accessibility for non-English speaking contributors.
2026-02-26 16:26:59 -03:00

38 KiB

omniroute — Kodebasedokumentasjon

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

En omfattende, nybegynnervennlig guide til omniroute multi-leverandør AI proxy-ruter.


1. Hva er omniroute?

omniroute er en proxy-ruter som sitter mellom AI-klienter (Claude CLI, Codex, Cursor IDE, etc.) og AI-leverandører (Anthropic, Google, OpenAI, AWS, GitHub, etc.). Det løser ett stort problem:

Ulike AI-klienter snakker forskjellige "språk" (API-formater), og forskjellige AI-leverandører forventer også forskjellige "språk". omniroute oversetter mellom dem automatisk.

Tenk på det som en universell oversetter i FN - enhver delegat kan snakke hvilket som helst språk, og oversetteren konverterer det til en hvilken som helst annen delegat.


2. Arkitekturoversikt

graph LR
    subgraph Clients
        A[Claude CLI]
        B[Codex]
        C[Cursor IDE]
        D[OpenAI-compatible]
    end

    subgraph omniroute
        E[Handler Layer]
        F[Translator Layer]
        G[Executor Layer]
        H[Services Layer]
    end

    subgraph Providers
        I[Anthropic Claude]
        J[Google Gemini]
        K[OpenAI / Codex]
        L[GitHub Copilot]
        M[AWS Kiro]
        N[Antigravity]
        O[Cursor API]
    end

    A --> E
    B --> E
    C --> E
    D --> E
    E --> F
    F --> G
    G --> I
    G --> J
    G --> K
    G --> L
    G --> M
    G --> N
    G --> O
    H -.-> E
    H -.-> G

Kjerneprinsipp: Hub-and-Speake-oversettelse

All formatoversettelse går gjennom OpenAI-formatet som navet:

Client Format → [OpenAI Hub] → Provider Format    (request)
Provider Format → [OpenAI Hub] → Client Format    (response)

Dette betyr at du bare trenger N oversettere (én per format) i stedet for (hvert par).


3. Prosjektstruktur

omniroute/
├── open-sse/                  ← Core proxy library (portable, framework-agnostic)
│   ├── index.js               ← Main entry point, exports everything
│   ├── config/                ← Configuration & constants
│   ├── executors/             ← Provider-specific request execution
│   ├── handlers/              ← Request handling orchestration
│   ├── services/              ← Business logic (auth, models, fallback, usage)
│   ├── translator/            ← Format translation engine
│   │   ├── request/           ← Request translators (8 files)
│   │   ├── response/          ← Response translators (7 files)
│   │   └── helpers/           ← Shared translation utilities (6 files)
│   └── utils/                 ← Utility functions
├── src/                       ← Application layer (Express/Worker runtime)
│   ├── app/                   ← Web UI, API routes, middleware
│   ├── lib/                   ← Database, auth, and shared library code
│   ├── mitm/                  ← Man-in-the-middle proxy utilities
│   ├── models/                ← Database models
│   ├── shared/                ← Shared utilities (wrappers around open-sse)
│   ├── sse/                   ← SSE endpoint handlers
│   └── store/                 ← State management
├── data/                      ← Runtime data (credentials, logs)
│   └── provider-credentials.json   (external credentials override, gitignored)
└── tester/                    ← Test utilities

4. Modul-for-modul-oversikt

4.1 Config (open-sse/config/)

enkelt kilde til sannhet for alle leverandørkonfigurasjoner.

Fil Formål
constants.ts PROVIDERS objekt med grunnleggende URL-er, OAuth-legitimasjon (standard), overskrifter og standard systemmeldinger for hver leverandør. Definerer også HTTP_STATUS, ERROR_TYPES, COOLDOWN_MS, BACKOFF_CONFIG og SKIP_PATTERNS.
credentialLoader.ts Laster inn ekstern legitimasjon fra data/provider-credentials.json og slår dem sammen over de hardkodede standardinnstillingene i PROVIDERS. Holder hemmeligheter utenfor kildekontroll samtidig som bakoverkompatibiliteten opprettholdes.
providerModels.ts Sentralt modellregister: kartleverandøraliaser → modell-ID-er. Funksjoner som getModels(), getProviderByAlias().
codexInstructions.ts Systeminstruksjoner injisert i Codex-forespørsler (redigeringsbegrensninger, sandkasseregler, godkjenningspolicyer).
defaultThinkingSignature.ts Standard "tenkende" signaturer for Claude og Gemini-modeller.
ollamaModels.ts Skjemadefinisjon for lokale Ollama-modeller (navn, størrelse, familie, kvantisering).

Innlastingsflyt for legitimasjon

flowchart TD
    A["App starts"] --> B["constants.ts defines PROVIDERS\nwith hardcoded defaults"]
    B --> C{"data/provider-credentials.json\nexists?"}
    C -->|Yes| D["credentialLoader reads JSON"]
    C -->|No| E["Use hardcoded defaults"]
    D --> F{"For each provider in JSON"}
    F --> G{"Provider exists\nin PROVIDERS?"}
    G -->|No| H["Log warning, skip"]
    G -->|Yes| I{"Value is object?"}
    I -->|No| J["Log warning, skip"]
    I -->|Yes| K["Merge clientId, clientSecret,\ntokenUrl, authUrl, refreshUrl"]
    K --> F
    H --> F
    J --> F
    F -->|Done| L["PROVIDERS ready with\nmerged credentials"]
    E --> L

4.2 Eksekutører (open-sse/executors/)

Eksekutører kapsler inn leverandørspesifikk logikk ved å bruke strategimønsteret. Hver eksekutør overstyrer basismetoder etter behov.

classDiagram
    class BaseExecutor {
        +buildUrl(model, stream, options)
        +buildHeaders(credentials, stream, body)
        +transformRequest(body, model, stream, credentials)
        +execute(url, options)
        +shouldRetry(status, error)
        +refreshCredentials(credentials, log)
    }

    class DefaultExecutor {
        +refreshCredentials()
    }

    class AntigravityExecutor {
        +buildUrl()
        +buildHeaders()
        +transformRequest()
        +shouldRetry()
        +refreshCredentials()
    }

    class CursorExecutor {
        +buildUrl()
        +buildHeaders()
        +transformRequest()
        +parseResponse()
        +generateChecksum()
    }

    class KiroExecutor {
        +buildUrl()
        +buildHeaders()
        +transformRequest()
        +parseEventStream()
        +refreshCredentials()
    }

    BaseExecutor <|-- DefaultExecutor
    BaseExecutor <|-- AntigravityExecutor
    BaseExecutor <|-- CursorExecutor
    BaseExecutor <|-- KiroExecutor
    BaseExecutor <|-- CodexExecutor
    BaseExecutor <|-- GeminiCLIExecutor
    BaseExecutor <|-- GithubExecutor
Utfører Leverandør Nøkkelspesialiseringer
base.ts Abstrakt base: URL-bygging, overskrifter, logikk på nytt, oppdatering av legitimasjon
default.ts Claude, Gemini, OpenAI, GLM, Kimi, MiniMax Generisk OAuth-tokenoppdatering for standardleverandører
antigravity.ts Google Cloud Code Prosjekt-/sesjons-ID generering, multi-URL fallback, tilpasset gjenforsøk på parsing fra feilmeldinger ("tilbakestill etter 2t7m23s")
cursor.ts Markør IDE Mest kompliserte: SHA-256 kontrollsum-authorisont, Protobuf-forespørselskoding, binær EventStream → SSE-svarparsing
codex.ts OpenAI Codex Injiserer systeminstruksjoner, administrerer tenkenivåer, fjerner ustøttede parametere
gemini-cli.ts Google Gemini CLI Egendefinert URL-bygging (streamGenerateContent), Google OAuth-tokenoppdatering
github.ts GitHub Copilot Dobbelt token-system (GitHub OAuth + Copilot-token), VSCode-header-etterligning
kiro.ts AWS CodeWhisperer AWS EventStream binær parsing, AMZN hendelsesrammer, token estimering
index.ts Fabrikk: navn på kartleverandør → eksekveringsklasse, med standard reserve

4.3 Behandlere (open-sse/handlers/)

Orkestreringslaget — koordinerer oversettelse, utførelse, strømming og feilhåndtering.

Fil Formål
chatCore.ts Sentralorkester (~600 linjer). Håndterer hele forespørselens livssyklus: formatdeteksjon → oversettelse → eksekveringssending → streaming/ikke-streaming-svar → token-oppdatering → feilhåndtering → brukslogging.
responsesHandler.ts Adapter for OpenAIs Responses API: konverterer svarformat → Chatfullføringer → sender til chatCore → konverterer SSE tilbake til svarformat.
embeddings.ts Innebyggingsgenereringshåndterer: løser innbyggingsmodell → leverandør, sender til leverandør-API, returnerer OpenAI-kompatibel innbyggingssvar. Støtter 6+ leverandører.
imageGeneration.ts Bildegenereringshåndterer: løser bildemodell → leverandør, støtter OpenAI-kompatibel, Gemini-image (Antigravity) og fallback (Nebius) moduser. Returnerer base64- eller URL-bilder.

Be om livssyklus (chatCore.ts)

sequenceDiagram
    participant Client
    participant chatCore
    participant Translator
    participant Executor
    participant Provider

    Client->>chatCore: Request (any format)
    chatCore->>chatCore: Detect source format
    chatCore->>chatCore: Check bypass patterns
    chatCore->>chatCore: Resolve model & provider
    chatCore->>Translator: Translate request (source → OpenAI → target)
    chatCore->>Executor: Get executor for provider
    Executor->>Executor: Build URL, headers, transform request
    Executor->>Executor: Refresh credentials if needed
    Executor->>Provider: HTTP fetch (streaming or non-streaming)

    alt Streaming
        Provider-->>chatCore: SSE stream
        chatCore->>chatCore: Pipe through SSE transform stream
        Note over chatCore: Transform stream translates<br/>each chunk: target → OpenAI → source
        chatCore-->>Client: Translated SSE stream
    else Non-streaming
        Provider-->>chatCore: JSON response
        chatCore->>Translator: Translate response
        chatCore-->>Client: Translated JSON
    end

    alt Error (401, 429, 500...)
        chatCore->>Executor: Retry with credential refresh
        chatCore->>chatCore: Account fallback logic
    end

4.4 Tjenester (open-sse/services/)

Forretningslogikk som støtter behandlerne og utførerne.

Fil Formål
provider.ts Formatgjenkjenning (detectFormat): analyser forespørsler om kroppsstruktur for å identifisere Claude/OpenAI/Gemini/Antigravity/Responses-formater (inkluderer max_tokens heuristikk for Claude). Også: URL-bygging, header-bygging, normalisering av tenkekonfigurasjon. Støtter openai-compatible-* og anthropic-compatible-* dynamiske leverandører.
model.ts Parsing av modellstreng (claude/model-name{provider: "claude", model: "model-name"}), aliasoppløsning med kollisjonsdeteksjon, inngangssanering (avviser banegjennomgang/kontrolltegn) og modellinformasjonsoppløsning med støtte for asynkron alias-getter.
accountFallback.ts Hastighetsgrensehåndtering: eksponentiell backoff (1s → 2s → 4s → maks 2min), kontonedkjølingsadministrasjon, feilklassifisering (hvilke feil utløser fallback kontra ikke).
tokenRefresh.ts OAuth-tokenoppdatering for alle leverandører: Google (Gemini, Antigravity), Claude, Codex, Qwen, iFlow, GitHub (OAuth + Copilot dual-token), Kiro (AWS SSO OIDC + Social Auth). Inkluderer under flyging løftededupliseringsbuffer og forsøk på nytt med eksponentiell backoff.
combo.ts Kombomodeller: kjeder av reservemodeller. Hvis modell A mislykkes med en fallback-kvalifisert feil, prøv modell B, deretter C osv. Returnerer faktiske oppstrømsstatuskoder.
usage.ts Henter kvote-/bruksdata fra leverandør-API-er (GitHub Copilot-kvoter, Antigravity-modellkvoter, Codex-hastighetsgrenser, Kiro-brukssammenbrudd, Claude-innstillinger).
accountSelector.ts Smart kontovalg med scoringsalgoritme: vurderer prioritet, helsestatus, round-robin-posisjon og nedkjølingstilstand for å velge den optimale kontoen for hver forespørsel.
contextManager.ts Be om kontekstlivssyklusadministrasjon: oppretter og sporer kontekstobjekter per forespørsel med metadata (forespørsels-ID, tidsstempler, leverandørinformasjon) for feilsøking og logging.
ipFilter.ts IP-basert tilgangskontroll: støtter tillatelsesliste- og blokkeringsmodus. Validerer klient-IP mot konfigurerte regler før API-forespørsler behandles.
sessionManager.ts Sesjonssporing med klientfingeravtrykk: sporer aktive økter ved å bruke hashed klientidentifikatorer, overvåker antall forespørsler og gir øktberegninger.
signatureCache.ts Forespørselssignaturbasert dedupliseringsbuffer: forhindrer dupliserte forespørsler ved å bufre nylige forespørselssignaturer og returnere bufrede svar for identiske forespørsler innen et tidsvindu.
systemPrompt.ts Global systemmeldingsinjeksjon: legger til eller legger til en konfigurerbar systemmelding til alle forespørsler, med kompatibilitetshåndtering per leverandør.
thinkingBudget.ts Reasoning token budsjettadministrasjon: støtter passthrough, auto (strip thinking config), tilpasset (fast budsjett) og adaptive (kompleksitetsskalert) moduser for å kontrollere tenkning/resonnering tokens.
wildcardRouter.ts Ruting av jokertegnmodellmønster: løser jokertegnmønstre (f.eks. */claude-*) til konkrete leverandør/modellpar basert på tilgjengelighet og prioritet.

Token Refresh Deduplisering

sequenceDiagram
    participant R1 as Request 1
    participant R2 as Request 2
    participant Cache as refreshPromiseCache
    participant OAuth as OAuth Provider

    R1->>Cache: getAccessToken("gemini", token)
    Cache->>Cache: No in-flight promise
    Cache->>OAuth: Start refresh
    R2->>Cache: getAccessToken("gemini", token)
    Cache->>Cache: Found in-flight promise
    Cache-->>R2: Return existing promise
    OAuth-->>Cache: New access token
    Cache-->>R1: New access token
    Cache-->>R2: Same access token (shared)
    Cache->>Cache: Delete cache entry

Account Reserve State Machine

stateDiagram-v2
    [*] --> Active
    Active --> Error: Request fails (401/429/500)
    Error --> Cooldown: Apply backoff
    Cooldown --> Active: Cooldown expires
    Active --> Active: Request succeeds (reset backoff)

    state Error {
        [*] --> ClassifyError
        ClassifyError --> ShouldFallback: Rate limit / Auth / Transient
        ClassifyError --> NoFallback: 400 Bad Request
    }

    state Cooldown {
        [*] --> ExponentialBackoff
        ExponentialBackoff: Level 0 = 1s
        ExponentialBackoff: Level 1 = 2s
        ExponentialBackoff: Level 2 = 4s
        ExponentialBackoff: Max = 2min
    }

Kombimodellkjede

flowchart LR
    A["Request with\ncombo model"] --> B["Model A"]
    B -->|"2xx Success"| C["Return response"]
    B -->|"429/401/500"| D{"Fallback\neligible?"}
    D -->|Yes| E["Model B"]
    D -->|No| F["Return error"]
    E -->|"2xx Success"| C
    E -->|"429/401/500"| G{"Fallback\neligible?"}
    G -->|Yes| H["Model C"]
    G -->|No| F
    H -->|"2xx Success"| C
    H -->|"Fail"| I["All failed →\nReturn last status"]

4.5 Oversetter (open-sse/translator/)

formatoversettelsesmotoren bruker et selvregistrerende plugin-system.

Arkitektur

graph TD
    subgraph "Request Translation"
        A["Claude → OpenAI"]
        B["Gemini → OpenAI"]
        C["Antigravity → OpenAI"]
        D["OpenAI Responses → OpenAI"]
        E["OpenAI → Claude"]
        F["OpenAI → Gemini"]
        G["OpenAI → Kiro"]
        H["OpenAI → Cursor"]
    end

    subgraph "Response Translation"
        I["Claude → OpenAI"]
        J["Gemini → OpenAI"]
        K["Kiro → OpenAI"]
        L["Cursor → OpenAI"]
        M["OpenAI → Claude"]
        N["OpenAI → Antigravity"]
        O["OpenAI → Responses"]
    end
Katalog Filer Beskrivelse
request/ 8 oversettere Konverter forespørselstekster mellom formater. Hver fil registreres selv via register(from, to, fn) ved import.
response/ 7 oversettere Konverter strømmeresponsbiter mellom formater. Håndterer SSE-hendelsestyper, tenkeblokker, verktøykall.
helpers/ 6 hjelpere Delte verktøy: claudeHelper (uttrekking av systemprompt, tenkekonfigurasjon), geminiHelper (deler-/innholdskartlegging), openaiHelper (formatfiltrering), toolCallHelper (ID-generering, manglende responsinjeksjon), _OMNITO.__2.
index.ts Oversettelsesmotor: translateRequest(), translateResponse(), statlig ledelse, register.
formats.ts Formatkonstanter: OPENAI, CLAUDE, GEMINI, ANTIGRAVITY, KIRO, CURSOR, OPENAI_RESPONSES.

Nøkkeldesign: Selvregistrerende plugins

// Each translator file calls register() on import:
import { register } from "../index.js";
register("claude", "openai", translateClaudeToOpenAI);

// The index.js imports all translator files, triggering registration:
import "./request/claude-to-openai.js"; // ← self-registers

4.6 Utils (open-sse/utils/)

Fil Formål
error.ts Bygging av feilrespons (OpenAI-kompatibelt format), oppstrøms feilparsing, Antigravity-utvinning på nytt fra feilmeldinger, SSE-feilstrømming.
stream.ts SSE Transform Stream — kjernestrømmingsrørledningen. To moduser: TRANSLATE (fullformatoversettelse) og PASSTHROUGH (normalisere + ekstraksjonsbruk). Håndterer chunk-buffring, bruksestimat, sporing av innholdslengde. Per-stream koder/dekoderforekomster unngår delt tilstand.
streamHelpers.ts SSE-verktøy på lavt nivå: parseSSELine (tomromtolerant), hasValuableContent (filtrerer tomme deler for OpenAI/Claude/Gemini), fixInvalidId, formatSSE (formatbevisst SSETOKEN101-opprydding med **1OMNI_-opprydding med **1OMNI_-opprydding).
usageTracking.ts Uttrekk av tokenbruk fra ethvert format (Claude/OpenAI/Gemini/Responses), estimering med separate verktøy/melding-char-per-token-forhold, buffertillegg (sikkerhetsmargin for 2000 tokens), formatspesifikk feltfiltrering, konsolllogging med ANSI-farger.
requestLogger.ts Filbasert forespørselslogging (opt-in via ENABLE_REQUEST_LOGS=true). Oppretter øktmapper med nummererte filer: 1_req_client.json7_res_client.txt. All I/O er asynkron (fire-and-forget). Maskerer sensitive overskrifter.
bypassHandler.ts Avskjærer spesifikke mønstre fra Claude CLI (tittelutvinning, oppvarming, telling) og returnerer falske svar uten å ringe noen leverandør. Støtter både streaming og ikke-streaming. Med vilje begrenset til Claude CLI-omfang.
networkProxy.ts Løser utgående proxy-URL for en gitt leverandør med prioritet: leverandørspesifikk konfig → global konfig → miljøvariabler (HTTPS_PROXY/HTTP_PROXY/ALL_PROXY). Støtter NO_PROXY ekskluderinger. Cacher konfigurasjon for 30s.

SSE Streaming Pipeline

flowchart TD
    A["Provider SSE stream"] --> B["TextDecoder\n(per-stream instance)"]
    B --> C["Buffer lines\n(split on newline)"]
    C --> D["parseSSELine()\n(trim whitespace, parse JSON)"]
    D --> E{"Mode?"}
    E -->|TRANSLATE| F["translateResponse()\ntarget → OpenAI → source"]
    E -->|PASSTHROUGH| G["fixInvalidId()\nnormalize chunk"]
    F --> H["hasValuableContent()\nfilter empty chunks"]
    G --> H
    H -->|"Has content"| I["extractUsage()\ntrack token counts"]
    H -->|"Empty"| J["Skip chunk"]
    I --> K["formatSSE()\nserialize + clean perf_metrics"]
    K --> L["TextEncoder\n(per-stream instance)"]
    L --> M["Enqueue to\nclient stream"]

    style A fill:#f9f,stroke:#333
    style M fill:#9f9,stroke:#333

Request Logger Session Struktur

logs/
└── claude_gemini_claude-sonnet_20260208_143045/
    ├── 1_req_client.json      ← Raw client request
    ├── 2_req_source.json      ← After initial conversion
    ├── 3_req_openai.json      ← OpenAI intermediate format
    ├── 4_req_target.json      ← Final target format
    ├── 5_res_provider.txt     ← Provider SSE chunks (streaming)
    ├── 5_res_provider.json    ← Provider response (non-streaming)
    ├── 6_res_openai.txt       ← OpenAI intermediate chunks
    ├── 7_res_client.txt       ← Client-facing SSE chunks
    └── 6_error.json           ← Error details (if any)

4.7 applikasjonslag (src/)

Katalog Formål
src/app/ Web-UI, API-ruter, Express-mellomvare, OAuth-tilbakeringsbehandlere
src/lib/ Databasetilgang (localDb.ts, usageDb.ts), autentisering, delt
src/mitm/ Man-in-the-midten proxy-verktøy for å avskjære leverandørtrafikk
src/models/ Databasemodelldefinisjoner
src/shared/ Omslag rundt åpne-sse-funksjoner (leverandør, strøm, feil osv.)
src/sse/ SSE-endepunktbehandlere som kobler open-sse-biblioteket til Express-ruter
src/store/ Søknadstilstandsadministrasjon

Bemerkelsesverdige API-ruter

Rute Metoder Formål
/api/provider-models GET/POST/SLETT CRUD for tilpassede modeller per leverandør
/api/models/catalog Samlet katalog over alle modeller (chat, innebygging, bilde, tilpasset) gruppert etter leverandør
/api/settings/proxy GET/SETT/SLETT Hierarkisk utgående proxy-konfigurasjon (global/providers/combos/keys)
/api/settings/proxy/test INNLEGG Validerer proxy-tilkobling og returnerer offentlig IP/latency
/v1/providers/[provider]/chat/completions INNLEGG Dedikerte chatfullføringer per leverandør med modellvalidering
/v1/providers/[provider]/embeddings INNLEGG Dedikerte innbygginger per leverandør med modellvalidering
/v1/providers/[provider]/images/generations INNLEGG Dedikert bildegenerering per leverandør med modellvalidering
/api/settings/ip-filter GET/SETT IP-godkjenningsliste/blokkeringslisteadministrasjon
/api/settings/thinking-budget GET/SETT Begrunnelse token budsjettkonfigurasjon (passthrough/auto/custom/adaptive)
/api/settings/system-prompt GET/SETT Global systemprompt injeksjon for alle forespørsler
/api/sessions Aktiv øktsporing og beregninger
/api/rate-limits Satsgrensestatus per konto

5. Nøkkeldesignmønstre

5.1 Hub-and-Speake-oversettelse

Alle formater oversettes gjennom OpenAI-formatet som navet. Å legge til en ny leverandør krever bare å skrive ett par med oversettere (til/fra OpenAI), ikke N par.

5.2 Eksekutørstrategimønster

Hver leverandør har en dedikert eksekutørklasse som arver fra BaseExecutor. Fabrikken i executors/index.ts velger den riktige ved kjøring.

5.3 Selvregistrerende pluginsystem

Oversettermoduler registrerer seg ved import via register(). Å legge til en ny oversetter er bare å lage en fil og importere den.

5.4 Kontotilbakeslag med eksponentiell backoff

Når en leverandør returnerer 429/401/500, kan systemet bytte til neste konto ved å bruke eksponentielle nedkjølinger (1s → 2s → 4s → maks 2min).

5.5 Combo modellkjeder

En "combo" grupperer flere provider/model strenger. Hvis den første mislykkes, fall tilbake til den neste automatisk.

5.6 Stateful streaming-oversettelse

Responsoversettelse opprettholder tilstanden på tvers av SSE-biter (tenkeblokksporing, akkumulering av verktøykall, indeksering av innholdsblokker) via initState()-mekanismen.

5.7 Brukssikkerhetsbuffer

En buffer på 2000 tokener legges til rapportert bruk for å hindre klienter i å nå grensene for kontekstvindu på grunn av overhead fra systemforespørsler og formatoversettelse.


6. Støttede formater

Format Retning Identifikator
OpenAI Chat-fullføringer kilde + mål openai
OpenAI Responses API kilde + mål openai-responses
Antropiske Claude kilde + mål claude
Google Gemini kilde + mål gemini
Google Gemini CLI kun mål gemini-cli
Antigravitasjon kilde + mål antigravity
AWS Kiro kun mål kiro
Markør kun mål cursor

7. Støttede leverandører

Leverandør Auth metode Utfører Nøkkelnotater
Antropiske Claude API-nøkkel eller OAuth Standard Bruker x-api-key header
Google Gemini API-nøkkel eller OAuth Standard Bruker x-goog-api-key header
Google Gemini CLI OAuth GeminiCLI Bruker streamGenerateContent endepunkt
Antigravitasjon OAuth Antigravitasjon Tilbakestilling av flere nettadresser, egendefinert prøv å analysere på nytt
OpenAI API-nøkkel Standard Standard bærer auth
Codex OAuth Codex Injiserer systeminstruksjoner, styrer tenkning
GitHub Copilot OAuth + Copilot-token Github Dobbelt token, VSCode header-etterligning
Kiro (AWS) AWS SSO OIDC eller Social Kiro Binær EventStream-parsing
Markør IDE Sjekksum auth Markør Protobuf-koding, SHA-256 kontrollsummer
Qwen OAuth Standard Standard auth
iFlow OAuth (Basic + Bearer) Standard Dobbel autentiseringshode
OpenRouter API-nøkkel Standard Standard bærer auth
GLM, Kimi, MiniMax API-nøkkel Standard Claude-kompatibel, bruk x-api-key
openai-compatible-* API-nøkkel Standard Dynamisk: ethvert OpenAI-kompatibelt endepunkt
anthropic-compatible-* API-nøkkel Standard Dynamisk: ethvert Claude-kompatibelt endepunkt

8. Dataflytsammendrag

Strømmeforespørsel

flowchart LR
    A["Client"] --> B["detectFormat()"]
    B --> C["translateRequest()\nsource → OpenAI → target"]
    C --> D["Executor\nbuildUrl + buildHeaders"]
    D --> E["fetch(providerURL)"]
    E --> F["createSSEStream()\nTRANSLATE mode"]
    F --> G["parseSSELine()"]
    G --> H["translateResponse()\ntarget → OpenAI → source"]
    H --> I["extractUsage()\n+ addBuffer"]
    I --> J["formatSSE()"]
    J --> K["Client receives\ntranslated SSE"]
    K --> L["logUsage()\nsaveRequestUsage()"]

Ikke-streamende forespørsel

flowchart LR
    A["Client"] --> B["detectFormat()"]
    B --> C["translateRequest()\nsource → OpenAI → target"]
    C --> D["Executor.execute()"]
    D --> E["translateResponse()\ntarget → OpenAI → source"]
    E --> F["Return JSON\nresponse"]

Bypass Flow (Claude CLI)

flowchart LR
    A["Claude CLI request"] --> B{"Match bypass\npattern?"}
    B -->|"Title/Warmup/Count"| C["Generate fake\nOpenAI response"]
    B -->|"No match"| D["Normal flow"]
    C --> E["Translate to\nsource format"]
    E --> F["Return without\ncalling provider"]