Add translated documentation files for multiple languages including Korean, Polish, and others under docs/i18n/. Translations cover API reference, quickstart guides, and project documentation to improve accessibility for non-English speaking contributors.
38 KiB
omniroute — Kodebasedokumentasjon
🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
En omfattende, nybegynnervennlig guide til omniroute multi-leverandør AI proxy-ruter.
1. Hva er omniroute?
omniroute er en proxy-ruter som sitter mellom AI-klienter (Claude CLI, Codex, Cursor IDE, etc.) og AI-leverandører (Anthropic, Google, OpenAI, AWS, GitHub, etc.). Det løser ett stort problem:
Ulike AI-klienter snakker forskjellige "språk" (API-formater), og forskjellige AI-leverandører forventer også forskjellige "språk". omniroute oversetter mellom dem automatisk.
Tenk på det som en universell oversetter i FN - enhver delegat kan snakke hvilket som helst språk, og oversetteren konverterer det til en hvilken som helst annen delegat.
2. Arkitekturoversikt
graph LR
subgraph Clients
A[Claude CLI]
B[Codex]
C[Cursor IDE]
D[OpenAI-compatible]
end
subgraph omniroute
E[Handler Layer]
F[Translator Layer]
G[Executor Layer]
H[Services Layer]
end
subgraph Providers
I[Anthropic Claude]
J[Google Gemini]
K[OpenAI / Codex]
L[GitHub Copilot]
M[AWS Kiro]
N[Antigravity]
O[Cursor API]
end
A --> E
B --> E
C --> E
D --> E
E --> F
F --> G
G --> I
G --> J
G --> K
G --> L
G --> M
G --> N
G --> O
H -.-> E
H -.-> G
Kjerneprinsipp: Hub-and-Speake-oversettelse
All formatoversettelse går gjennom OpenAI-formatet som navet:
Client Format → [OpenAI Hub] → Provider Format (request)
Provider Format → [OpenAI Hub] → Client Format (response)
Dette betyr at du bare trenger N oversettere (én per format) i stedet for N² (hvert par).
3. Prosjektstruktur
omniroute/
├── open-sse/ ← Core proxy library (portable, framework-agnostic)
│ ├── index.js ← Main entry point, exports everything
│ ├── config/ ← Configuration & constants
│ ├── executors/ ← Provider-specific request execution
│ ├── handlers/ ← Request handling orchestration
│ ├── services/ ← Business logic (auth, models, fallback, usage)
│ ├── translator/ ← Format translation engine
│ │ ├── request/ ← Request translators (8 files)
│ │ ├── response/ ← Response translators (7 files)
│ │ └── helpers/ ← Shared translation utilities (6 files)
│ └── utils/ ← Utility functions
├── src/ ← Application layer (Express/Worker runtime)
│ ├── app/ ← Web UI, API routes, middleware
│ ├── lib/ ← Database, auth, and shared library code
│ ├── mitm/ ← Man-in-the-middle proxy utilities
│ ├── models/ ← Database models
│ ├── shared/ ← Shared utilities (wrappers around open-sse)
│ ├── sse/ ← SSE endpoint handlers
│ └── store/ ← State management
├── data/ ← Runtime data (credentials, logs)
│ └── provider-credentials.json (external credentials override, gitignored)
└── tester/ ← Test utilities
4. Modul-for-modul-oversikt
4.1 Config (open-sse/config/)
enkelt kilde til sannhet for alle leverandørkonfigurasjoner.
| Fil | Formål |
|---|---|
constants.ts |
PROVIDERS objekt med grunnleggende URL-er, OAuth-legitimasjon (standard), overskrifter og standard systemmeldinger for hver leverandør. Definerer også HTTP_STATUS, ERROR_TYPES, COOLDOWN_MS, BACKOFF_CONFIG og SKIP_PATTERNS. |
credentialLoader.ts |
Laster inn ekstern legitimasjon fra data/provider-credentials.json og slår dem sammen over de hardkodede standardinnstillingene i PROVIDERS. Holder hemmeligheter utenfor kildekontroll samtidig som bakoverkompatibiliteten opprettholdes. |
providerModels.ts |
Sentralt modellregister: kartleverandøraliaser → modell-ID-er. Funksjoner som getModels(), getProviderByAlias(). |
codexInstructions.ts |
Systeminstruksjoner injisert i Codex-forespørsler (redigeringsbegrensninger, sandkasseregler, godkjenningspolicyer). |
defaultThinkingSignature.ts |
Standard "tenkende" signaturer for Claude og Gemini-modeller. |
ollamaModels.ts |
Skjemadefinisjon for lokale Ollama-modeller (navn, størrelse, familie, kvantisering). |
Innlastingsflyt for legitimasjon
flowchart TD
A["App starts"] --> B["constants.ts defines PROVIDERS\nwith hardcoded defaults"]
B --> C{"data/provider-credentials.json\nexists?"}
C -->|Yes| D["credentialLoader reads JSON"]
C -->|No| E["Use hardcoded defaults"]
D --> F{"For each provider in JSON"}
F --> G{"Provider exists\nin PROVIDERS?"}
G -->|No| H["Log warning, skip"]
G -->|Yes| I{"Value is object?"}
I -->|No| J["Log warning, skip"]
I -->|Yes| K["Merge clientId, clientSecret,\ntokenUrl, authUrl, refreshUrl"]
K --> F
H --> F
J --> F
F -->|Done| L["PROVIDERS ready with\nmerged credentials"]
E --> L
4.2 Eksekutører (open-sse/executors/)
Eksekutører kapsler inn leverandørspesifikk logikk ved å bruke strategimønsteret. Hver eksekutør overstyrer basismetoder etter behov.
classDiagram
class BaseExecutor {
+buildUrl(model, stream, options)
+buildHeaders(credentials, stream, body)
+transformRequest(body, model, stream, credentials)
+execute(url, options)
+shouldRetry(status, error)
+refreshCredentials(credentials, log)
}
class DefaultExecutor {
+refreshCredentials()
}
class AntigravityExecutor {
+buildUrl()
+buildHeaders()
+transformRequest()
+shouldRetry()
+refreshCredentials()
}
class CursorExecutor {
+buildUrl()
+buildHeaders()
+transformRequest()
+parseResponse()
+generateChecksum()
}
class KiroExecutor {
+buildUrl()
+buildHeaders()
+transformRequest()
+parseEventStream()
+refreshCredentials()
}
BaseExecutor <|-- DefaultExecutor
BaseExecutor <|-- AntigravityExecutor
BaseExecutor <|-- CursorExecutor
BaseExecutor <|-- KiroExecutor
BaseExecutor <|-- CodexExecutor
BaseExecutor <|-- GeminiCLIExecutor
BaseExecutor <|-- GithubExecutor
| Utfører | Leverandør | Nøkkelspesialiseringer |
|---|---|---|
base.ts |
— | Abstrakt base: URL-bygging, overskrifter, logikk på nytt, oppdatering av legitimasjon |
default.ts |
Claude, Gemini, OpenAI, GLM, Kimi, MiniMax | Generisk OAuth-tokenoppdatering for standardleverandører |
antigravity.ts |
Google Cloud Code | Prosjekt-/sesjons-ID generering, multi-URL fallback, tilpasset gjenforsøk på parsing fra feilmeldinger ("tilbakestill etter 2t7m23s") |
cursor.ts |
Markør IDE | Mest kompliserte: SHA-256 kontrollsum-authorisont, Protobuf-forespørselskoding, binær EventStream → SSE-svarparsing |
codex.ts |
OpenAI Codex | Injiserer systeminstruksjoner, administrerer tenkenivåer, fjerner ustøttede parametere |
gemini-cli.ts |
Google Gemini CLI | Egendefinert URL-bygging (streamGenerateContent), Google OAuth-tokenoppdatering |
github.ts |
GitHub Copilot | Dobbelt token-system (GitHub OAuth + Copilot-token), VSCode-header-etterligning |
kiro.ts |
AWS CodeWhisperer | AWS EventStream binær parsing, AMZN hendelsesrammer, token estimering |
index.ts |
— | Fabrikk: navn på kartleverandør → eksekveringsklasse, med standard reserve |
4.3 Behandlere (open-sse/handlers/)
Orkestreringslaget — koordinerer oversettelse, utførelse, strømming og feilhåndtering.
| Fil | Formål |
|---|---|
chatCore.ts |
Sentralorkester (~600 linjer). Håndterer hele forespørselens livssyklus: formatdeteksjon → oversettelse → eksekveringssending → streaming/ikke-streaming-svar → token-oppdatering → feilhåndtering → brukslogging. |
responsesHandler.ts |
Adapter for OpenAIs Responses API: konverterer svarformat → Chatfullføringer → sender til chatCore → konverterer SSE tilbake til svarformat. |
embeddings.ts |
Innebyggingsgenereringshåndterer: løser innbyggingsmodell → leverandør, sender til leverandør-API, returnerer OpenAI-kompatibel innbyggingssvar. Støtter 6+ leverandører. |
imageGeneration.ts |
Bildegenereringshåndterer: løser bildemodell → leverandør, støtter OpenAI-kompatibel, Gemini-image (Antigravity) og fallback (Nebius) moduser. Returnerer base64- eller URL-bilder. |
Be om livssyklus (chatCore.ts)
sequenceDiagram
participant Client
participant chatCore
participant Translator
participant Executor
participant Provider
Client->>chatCore: Request (any format)
chatCore->>chatCore: Detect source format
chatCore->>chatCore: Check bypass patterns
chatCore->>chatCore: Resolve model & provider
chatCore->>Translator: Translate request (source → OpenAI → target)
chatCore->>Executor: Get executor for provider
Executor->>Executor: Build URL, headers, transform request
Executor->>Executor: Refresh credentials if needed
Executor->>Provider: HTTP fetch (streaming or non-streaming)
alt Streaming
Provider-->>chatCore: SSE stream
chatCore->>chatCore: Pipe through SSE transform stream
Note over chatCore: Transform stream translates<br/>each chunk: target → OpenAI → source
chatCore-->>Client: Translated SSE stream
else Non-streaming
Provider-->>chatCore: JSON response
chatCore->>Translator: Translate response
chatCore-->>Client: Translated JSON
end
alt Error (401, 429, 500...)
chatCore->>Executor: Retry with credential refresh
chatCore->>chatCore: Account fallback logic
end
4.4 Tjenester (open-sse/services/)
Forretningslogikk som støtter behandlerne og utførerne.
| Fil | Formål |
|---|---|
provider.ts |
Formatgjenkjenning (detectFormat): analyser forespørsler om kroppsstruktur for å identifisere Claude/OpenAI/Gemini/Antigravity/Responses-formater (inkluderer max_tokens heuristikk for Claude). Også: URL-bygging, header-bygging, normalisering av tenkekonfigurasjon. Støtter openai-compatible-* og anthropic-compatible-* dynamiske leverandører. |
model.ts |
Parsing av modellstreng (claude/model-name → {provider: "claude", model: "model-name"}), aliasoppløsning med kollisjonsdeteksjon, inngangssanering (avviser banegjennomgang/kontrolltegn) og modellinformasjonsoppløsning med støtte for asynkron alias-getter. |
accountFallback.ts |
Hastighetsgrensehåndtering: eksponentiell backoff (1s → 2s → 4s → maks 2min), kontonedkjølingsadministrasjon, feilklassifisering (hvilke feil utløser fallback kontra ikke). |
tokenRefresh.ts |
OAuth-tokenoppdatering for alle leverandører: Google (Gemini, Antigravity), Claude, Codex, Qwen, iFlow, GitHub (OAuth + Copilot dual-token), Kiro (AWS SSO OIDC + Social Auth). Inkluderer under flyging løftededupliseringsbuffer og forsøk på nytt med eksponentiell backoff. |
combo.ts |
Kombomodeller: kjeder av reservemodeller. Hvis modell A mislykkes med en fallback-kvalifisert feil, prøv modell B, deretter C osv. Returnerer faktiske oppstrømsstatuskoder. |
usage.ts |
Henter kvote-/bruksdata fra leverandør-API-er (GitHub Copilot-kvoter, Antigravity-modellkvoter, Codex-hastighetsgrenser, Kiro-brukssammenbrudd, Claude-innstillinger). |
accountSelector.ts |
Smart kontovalg med scoringsalgoritme: vurderer prioritet, helsestatus, round-robin-posisjon og nedkjølingstilstand for å velge den optimale kontoen for hver forespørsel. |
contextManager.ts |
Be om kontekstlivssyklusadministrasjon: oppretter og sporer kontekstobjekter per forespørsel med metadata (forespørsels-ID, tidsstempler, leverandørinformasjon) for feilsøking og logging. |
ipFilter.ts |
IP-basert tilgangskontroll: støtter tillatelsesliste- og blokkeringsmodus. Validerer klient-IP mot konfigurerte regler før API-forespørsler behandles. |
sessionManager.ts |
Sesjonssporing med klientfingeravtrykk: sporer aktive økter ved å bruke hashed klientidentifikatorer, overvåker antall forespørsler og gir øktberegninger. |
signatureCache.ts |
Forespørselssignaturbasert dedupliseringsbuffer: forhindrer dupliserte forespørsler ved å bufre nylige forespørselssignaturer og returnere bufrede svar for identiske forespørsler innen et tidsvindu. |
systemPrompt.ts |
Global systemmeldingsinjeksjon: legger til eller legger til en konfigurerbar systemmelding til alle forespørsler, med kompatibilitetshåndtering per leverandør. |
thinkingBudget.ts |
Reasoning token budsjettadministrasjon: støtter passthrough, auto (strip thinking config), tilpasset (fast budsjett) og adaptive (kompleksitetsskalert) moduser for å kontrollere tenkning/resonnering tokens. |
wildcardRouter.ts |
Ruting av jokertegnmodellmønster: løser jokertegnmønstre (f.eks. */claude-*) til konkrete leverandør/modellpar basert på tilgjengelighet og prioritet. |
Token Refresh Deduplisering
sequenceDiagram
participant R1 as Request 1
participant R2 as Request 2
participant Cache as refreshPromiseCache
participant OAuth as OAuth Provider
R1->>Cache: getAccessToken("gemini", token)
Cache->>Cache: No in-flight promise
Cache->>OAuth: Start refresh
R2->>Cache: getAccessToken("gemini", token)
Cache->>Cache: Found in-flight promise
Cache-->>R2: Return existing promise
OAuth-->>Cache: New access token
Cache-->>R1: New access token
Cache-->>R2: Same access token (shared)
Cache->>Cache: Delete cache entry
Account Reserve State Machine
stateDiagram-v2
[*] --> Active
Active --> Error: Request fails (401/429/500)
Error --> Cooldown: Apply backoff
Cooldown --> Active: Cooldown expires
Active --> Active: Request succeeds (reset backoff)
state Error {
[*] --> ClassifyError
ClassifyError --> ShouldFallback: Rate limit / Auth / Transient
ClassifyError --> NoFallback: 400 Bad Request
}
state Cooldown {
[*] --> ExponentialBackoff
ExponentialBackoff: Level 0 = 1s
ExponentialBackoff: Level 1 = 2s
ExponentialBackoff: Level 2 = 4s
ExponentialBackoff: Max = 2min
}
Kombimodellkjede
flowchart LR
A["Request with\ncombo model"] --> B["Model A"]
B -->|"2xx Success"| C["Return response"]
B -->|"429/401/500"| D{"Fallback\neligible?"}
D -->|Yes| E["Model B"]
D -->|No| F["Return error"]
E -->|"2xx Success"| C
E -->|"429/401/500"| G{"Fallback\neligible?"}
G -->|Yes| H["Model C"]
G -->|No| F
H -->|"2xx Success"| C
H -->|"Fail"| I["All failed →\nReturn last status"]
4.5 Oversetter (open-sse/translator/)
formatoversettelsesmotoren bruker et selvregistrerende plugin-system.
Arkitektur
graph TD
subgraph "Request Translation"
A["Claude → OpenAI"]
B["Gemini → OpenAI"]
C["Antigravity → OpenAI"]
D["OpenAI Responses → OpenAI"]
E["OpenAI → Claude"]
F["OpenAI → Gemini"]
G["OpenAI → Kiro"]
H["OpenAI → Cursor"]
end
subgraph "Response Translation"
I["Claude → OpenAI"]
J["Gemini → OpenAI"]
K["Kiro → OpenAI"]
L["Cursor → OpenAI"]
M["OpenAI → Claude"]
N["OpenAI → Antigravity"]
O["OpenAI → Responses"]
end
| Katalog | Filer | Beskrivelse |
|---|---|---|
request/ |
8 oversettere | Konverter forespørselstekster mellom formater. Hver fil registreres selv via register(from, to, fn) ved import. |
response/ |
7 oversettere | Konverter strømmeresponsbiter mellom formater. Håndterer SSE-hendelsestyper, tenkeblokker, verktøykall. |
helpers/ |
6 hjelpere | Delte verktøy: claudeHelper (uttrekking av systemprompt, tenkekonfigurasjon), geminiHelper (deler-/innholdskartlegging), openaiHelper (formatfiltrering), toolCallHelper (ID-generering, manglende responsinjeksjon), _OMNITO.__2. |
index.ts |
— | Oversettelsesmotor: translateRequest(), translateResponse(), statlig ledelse, register. |
formats.ts |
— | Formatkonstanter: OPENAI, CLAUDE, GEMINI, ANTIGRAVITY, KIRO, CURSOR, OPENAI_RESPONSES. |
Nøkkeldesign: Selvregistrerende plugins
// Each translator file calls register() on import:
import { register } from "../index.js";
register("claude", "openai", translateClaudeToOpenAI);
// The index.js imports all translator files, triggering registration:
import "./request/claude-to-openai.js"; // ← self-registers
4.6 Utils (open-sse/utils/)
| Fil | Formål |
|---|---|
error.ts |
Bygging av feilrespons (OpenAI-kompatibelt format), oppstrøms feilparsing, Antigravity-utvinning på nytt fra feilmeldinger, SSE-feilstrømming. |
stream.ts |
SSE Transform Stream — kjernestrømmingsrørledningen. To moduser: TRANSLATE (fullformatoversettelse) og PASSTHROUGH (normalisere + ekstraksjonsbruk). Håndterer chunk-buffring, bruksestimat, sporing av innholdslengde. Per-stream koder/dekoderforekomster unngår delt tilstand. |
streamHelpers.ts |
SSE-verktøy på lavt nivå: parseSSELine (tomromtolerant), hasValuableContent (filtrerer tomme deler for OpenAI/Claude/Gemini), fixInvalidId, formatSSE (formatbevisst SSETOKEN101-opprydding med **1OMNI_-opprydding med **1OMNI_-opprydding). |
usageTracking.ts |
Uttrekk av tokenbruk fra ethvert format (Claude/OpenAI/Gemini/Responses), estimering med separate verktøy/melding-char-per-token-forhold, buffertillegg (sikkerhetsmargin for 2000 tokens), formatspesifikk feltfiltrering, konsolllogging med ANSI-farger. |
requestLogger.ts |
Filbasert forespørselslogging (opt-in via ENABLE_REQUEST_LOGS=true). Oppretter øktmapper med nummererte filer: 1_req_client.json → 7_res_client.txt. All I/O er asynkron (fire-and-forget). Maskerer sensitive overskrifter. |
bypassHandler.ts |
Avskjærer spesifikke mønstre fra Claude CLI (tittelutvinning, oppvarming, telling) og returnerer falske svar uten å ringe noen leverandør. Støtter både streaming og ikke-streaming. Med vilje begrenset til Claude CLI-omfang. |
networkProxy.ts |
Løser utgående proxy-URL for en gitt leverandør med prioritet: leverandørspesifikk konfig → global konfig → miljøvariabler (HTTPS_PROXY/HTTP_PROXY/ALL_PROXY). Støtter NO_PROXY ekskluderinger. Cacher konfigurasjon for 30s. |
SSE Streaming Pipeline
flowchart TD
A["Provider SSE stream"] --> B["TextDecoder\n(per-stream instance)"]
B --> C["Buffer lines\n(split on newline)"]
C --> D["parseSSELine()\n(trim whitespace, parse JSON)"]
D --> E{"Mode?"}
E -->|TRANSLATE| F["translateResponse()\ntarget → OpenAI → source"]
E -->|PASSTHROUGH| G["fixInvalidId()\nnormalize chunk"]
F --> H["hasValuableContent()\nfilter empty chunks"]
G --> H
H -->|"Has content"| I["extractUsage()\ntrack token counts"]
H -->|"Empty"| J["Skip chunk"]
I --> K["formatSSE()\nserialize + clean perf_metrics"]
K --> L["TextEncoder\n(per-stream instance)"]
L --> M["Enqueue to\nclient stream"]
style A fill:#f9f,stroke:#333
style M fill:#9f9,stroke:#333
Request Logger Session Struktur
logs/
└── claude_gemini_claude-sonnet_20260208_143045/
├── 1_req_client.json ← Raw client request
├── 2_req_source.json ← After initial conversion
├── 3_req_openai.json ← OpenAI intermediate format
├── 4_req_target.json ← Final target format
├── 5_res_provider.txt ← Provider SSE chunks (streaming)
├── 5_res_provider.json ← Provider response (non-streaming)
├── 6_res_openai.txt ← OpenAI intermediate chunks
├── 7_res_client.txt ← Client-facing SSE chunks
└── 6_error.json ← Error details (if any)
4.7 applikasjonslag (src/)
| Katalog | Formål |
|---|---|
src/app/ |
Web-UI, API-ruter, Express-mellomvare, OAuth-tilbakeringsbehandlere |
src/lib/ |
Databasetilgang (localDb.ts, usageDb.ts), autentisering, delt |
src/mitm/ |
Man-in-the-midten proxy-verktøy for å avskjære leverandørtrafikk |
src/models/ |
Databasemodelldefinisjoner |
src/shared/ |
Omslag rundt åpne-sse-funksjoner (leverandør, strøm, feil osv.) |
src/sse/ |
SSE-endepunktbehandlere som kobler open-sse-biblioteket til Express-ruter |
src/store/ |
Søknadstilstandsadministrasjon |
Bemerkelsesverdige API-ruter
| Rute | Metoder | Formål |
|---|---|---|
/api/provider-models |
GET/POST/SLETT | CRUD for tilpassede modeller per leverandør |
/api/models/catalog |
FÅ | Samlet katalog over alle modeller (chat, innebygging, bilde, tilpasset) gruppert etter leverandør |
/api/settings/proxy |
GET/SETT/SLETT | Hierarkisk utgående proxy-konfigurasjon (global/providers/combos/keys) |
/api/settings/proxy/test |
INNLEGG | Validerer proxy-tilkobling og returnerer offentlig IP/latency |
/v1/providers/[provider]/chat/completions |
INNLEGG | Dedikerte chatfullføringer per leverandør med modellvalidering |
/v1/providers/[provider]/embeddings |
INNLEGG | Dedikerte innbygginger per leverandør med modellvalidering |
/v1/providers/[provider]/images/generations |
INNLEGG | Dedikert bildegenerering per leverandør med modellvalidering |
/api/settings/ip-filter |
GET/SETT | IP-godkjenningsliste/blokkeringslisteadministrasjon |
/api/settings/thinking-budget |
GET/SETT | Begrunnelse token budsjettkonfigurasjon (passthrough/auto/custom/adaptive) |
/api/settings/system-prompt |
GET/SETT | Global systemprompt injeksjon for alle forespørsler |
/api/sessions |
FÅ | Aktiv øktsporing og beregninger |
/api/rate-limits |
FÅ | Satsgrensestatus per konto |
5. Nøkkeldesignmønstre
5.1 Hub-and-Speake-oversettelse
Alle formater oversettes gjennom OpenAI-formatet som navet. Å legge til en ny leverandør krever bare å skrive ett par med oversettere (til/fra OpenAI), ikke N par.
5.2 Eksekutørstrategimønster
Hver leverandør har en dedikert eksekutørklasse som arver fra BaseExecutor. Fabrikken i executors/index.ts velger den riktige ved kjøring.
5.3 Selvregistrerende pluginsystem
Oversettermoduler registrerer seg ved import via register(). Å legge til en ny oversetter er bare å lage en fil og importere den.
5.4 Kontotilbakeslag med eksponentiell backoff
Når en leverandør returnerer 429/401/500, kan systemet bytte til neste konto ved å bruke eksponentielle nedkjølinger (1s → 2s → 4s → maks 2min).
5.5 Combo modellkjeder
En "combo" grupperer flere provider/model strenger. Hvis den første mislykkes, fall tilbake til den neste automatisk.
5.6 Stateful streaming-oversettelse
Responsoversettelse opprettholder tilstanden på tvers av SSE-biter (tenkeblokksporing, akkumulering av verktøykall, indeksering av innholdsblokker) via initState()-mekanismen.
5.7 Brukssikkerhetsbuffer
En buffer på 2000 tokener legges til rapportert bruk for å hindre klienter i å nå grensene for kontekstvindu på grunn av overhead fra systemforespørsler og formatoversettelse.
6. Støttede formater
| Format | Retning | Identifikator |
|---|---|---|
| OpenAI Chat-fullføringer | kilde + mål | openai |
| OpenAI Responses API | kilde + mål | openai-responses |
| Antropiske Claude | kilde + mål | claude |
| Google Gemini | kilde + mål | gemini |
| Google Gemini CLI | kun mål | gemini-cli |
| Antigravitasjon | kilde + mål | antigravity |
| AWS Kiro | kun mål | kiro |
| Markør | kun mål | cursor |
7. Støttede leverandører
| Leverandør | Auth metode | Utfører | Nøkkelnotater |
|---|---|---|---|
| Antropiske Claude | API-nøkkel eller OAuth | Standard | Bruker x-api-key header |
| Google Gemini | API-nøkkel eller OAuth | Standard | Bruker x-goog-api-key header |
| Google Gemini CLI | OAuth | GeminiCLI | Bruker streamGenerateContent endepunkt |
| Antigravitasjon | OAuth | Antigravitasjon | Tilbakestilling av flere nettadresser, egendefinert prøv å analysere på nytt |
| OpenAI | API-nøkkel | Standard | Standard bærer auth |
| Codex | OAuth | Codex | Injiserer systeminstruksjoner, styrer tenkning |
| GitHub Copilot | OAuth + Copilot-token | Github | Dobbelt token, VSCode header-etterligning |
| Kiro (AWS) | AWS SSO OIDC eller Social | Kiro | Binær EventStream-parsing |
| Markør IDE | Sjekksum auth | Markør | Protobuf-koding, SHA-256 kontrollsummer |
| Qwen | OAuth | Standard | Standard auth |
| iFlow | OAuth (Basic + Bearer) | Standard | Dobbel autentiseringshode |
| OpenRouter | API-nøkkel | Standard | Standard bærer auth |
| GLM, Kimi, MiniMax | API-nøkkel | Standard | Claude-kompatibel, bruk x-api-key |
openai-compatible-* |
API-nøkkel | Standard | Dynamisk: ethvert OpenAI-kompatibelt endepunkt |
anthropic-compatible-* |
API-nøkkel | Standard | Dynamisk: ethvert Claude-kompatibelt endepunkt |
8. Dataflytsammendrag
Strømmeforespørsel
flowchart LR
A["Client"] --> B["detectFormat()"]
B --> C["translateRequest()\nsource → OpenAI → target"]
C --> D["Executor\nbuildUrl + buildHeaders"]
D --> E["fetch(providerURL)"]
E --> F["createSSEStream()\nTRANSLATE mode"]
F --> G["parseSSELine()"]
G --> H["translateResponse()\ntarget → OpenAI → source"]
H --> I["extractUsage()\n+ addBuffer"]
I --> J["formatSSE()"]
J --> K["Client receives\ntranslated SSE"]
K --> L["logUsage()\nsaveRequestUsage()"]
Ikke-streamende forespørsel
flowchart LR
A["Client"] --> B["detectFormat()"]
B --> C["translateRequest()\nsource → OpenAI → target"]
C --> D["Executor.execute()"]
D --> E["translateResponse()\ntarget → OpenAI → source"]
E --> F["Return JSON\nresponse"]
Bypass Flow (Claude CLI)
flowchart LR
A["Claude CLI request"] --> B{"Match bypass\npattern?"}
B -->|"Title/Warmup/Count"| C["Generate fake\nOpenAI response"]
B -->|"No match"| D["Normal flow"]
C --> E["Translate to\nsource format"]
E --> F["Return without\ncalling provider"]