OmniRoute/docs/i18n/de/README.md
2026-04-06 18:11:09 -03:00

119 KiB
Raw Blame History

🚀 OmniRoute — The Free AI Gateway (Deutsch)

🌐 Languages: 🇺🇸 English · 🇪🇸 es · 🇫🇷 fr · 🇩🇪 de · 🇮🇹 it · 🇷🇺 ru · 🇨🇳 zh-CN · 🇯🇵 ja · 🇰🇷 ko · 🇸🇦 ar · 🇮🇳 hi · 🇮🇳 in · 🇹🇭 th · 🇻🇳 vi · 🇮🇩 id · 🇲🇾 ms · 🇳🇱 nl · 🇵🇱 pl · 🇸🇪 sv · 🇳🇴 no · 🇩🇰 da · 🇫🇮 fi · 🇵🇹 pt · 🇷🇴 ro · 🇭🇺 hu · 🇧🇬 bg · 🇸🇰 sk · 🇺🇦 uk-UA · 🇮🇱 he · 🇵🇭 phi · 🇧🇷 pt-BR · 🇨🇿 cs · 🇹🇷 tr


Never stop coding. Smart routing to FREE & low-cost AI models with automatic fallback.

Ihr universeller API-Proxy ein Endpunkt, über 60 Anbieter, keine Ausfallzeiten. Jetzt mitMCP Server (25 Tools),A2A-Protokoll,Speicher-/Skills-SystemeundElectron Desktop App.

Chat-Abschlüsse • Einbettungen • Bildgenerierung • Video • Musik • Audio • Reranking •Websuche• MCP-Server • A2A-Protokoll • 100 % TypeScript---

🌐Verfügbar in:🇺🇸 Englisch | 🇧🇷 Português (Brasilien) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italienisch | 🇷🇺 Russisch | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dänisch | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Niederlande | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polnisch | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino | 🇨🇿 Čeština---

🖼️ Main Dashboard

OmniRoute Dashboard

📸 Dashboard Preview

Klicken Sie hier, um Dashboard-Screenshots anzuzeigen
Seite Screenshot
Anbieter Anbieter
Kombinationen Combos
Analytik Analytics
Gesundheit Gesundheit
Übersetzer Übersetzer
Einstellungen Einstellungen
CLI-Tools CLI-Tools
Nutzungsprotokolle Nutzung
Endpunkte Endpunkte

🤖 Free AI Provider for your favorite coding agents

Verbinden Sie jedes KI-gestützte IDE- oder CLI-Tool über OmniRoute kostenloses API-Gateway für unbegrenzte Codierung.

OpenClaw
OpenClaw

205K NanoBot
NanoBot

20,9K PicoClaw
PicoClaw

14,6K ZeroClaw
ZeroClaw

9,9K IronClaw
Eisenklaue

2,1K OpenCode
OpenCode

106K Codex CLI
Codex-CLI

60,8K Claude Code
Claude Code

67,3K Gemini CLI
Gemini-CLI

94,7K Kilo Code
Kilo-Code

15,5K

📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 eine Konfiguration, unbegrenzte Modelle und Kontingent---

🤔 Why OmniRoute?

Hören Sie auf, Geld zu verschwenden und an Grenzen zu stoßen:

  • Das Abonnementkontingent läuft jeden Monat ungenutzt ab
  • Ratenbeschränkungen stoppen Sie mitten beim Codieren Teure APIs (2050 $/Monat pro Anbieter)
  • Manueller Wechsel zwischen Anbietern

OmniRoute löst dieses Problem:

  • Abonnements maximieren- Verfolgen Sie das Kontingent, nutzen Sie jedes Bit vor dem Zurücksetzen
  • Auto-Fallback Abonnement → API-Schlüssel → Günstig → Kostenlos, keine Ausfallzeiten
  • Mehrere Konten Round-Robin zwischen Konten pro Anbieter
  • Universell Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw und jedem CLI-Tool---

📧 Support

💬Treten Sie unserer Community bei!WhatsApp-Gruppe Holen Sie sich Hilfe, tauschen Sie Tipps aus und bleiben Sie auf dem Laufenden.

-Website: omniroute.online -GitHub: github.com/diegosouzapw/OmniRoute -Probleme: github.com/diegosouzapw/OmniRoute/issues -WhatsApp: Community-Gruppe -Mitwirken: Siehe CONTRIBUTING.md, öffnen Sie eine PR oder wählen Sie eine „gute erste Ausgabe“ aus -Originalprojekt: 9router von decolua### 🐛 Reporting a Bug?

Wenn Sie ein Problem öffnen, führen Sie bitte den Befehl „system-info“ aus und hängen Sie die generierte Datei an:```bash npm run system-info


Dadurch wird eine „system-info.txt“ mit Ihrer Node.js-Version, OmniRoute-Version, Betriebssystemdetails, installierten CLI-Tools (Qoder, Gemini, Claude, Codex, Antigravity, Droid usw.), Docker/PM2-Status und Systempaketen generiert  alles, was wir brauchen, um Ihr Problem schnell zu reproduzieren. Hängen Sie die Datei direkt an Ihr GitHub-Problem an.---

## 🔄 How It Works

┌─────────────┐ │ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...) │ Tool │ └──────┬──────┘ │ http://localhost:20128/v1 ↓ ┌─────────────────────────────────────────┐ │ OmniRoute (Smart Router) │ │ • Format translation (OpenAI ↔ Claude) │ │ • Quota tracking + Embeddings + Images │ │ • Auto token refresh │ └──────┬──────────────────────────────────┘ │ ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI │ ↓ quota exhausted ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc. │ ↓ budget limit ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M) │ ↓ budget limit └─→ [Tier 4: FREE] Qoder, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost


---

## 🎯 What OmniRoute Solves — 30 Real Pain Points & Use Cases

>**Jeder Entwickler, der KI-Tools verwendet, ist täglich mit diesen Problemen konfrontiert.**OmniRoute wurde entwickelt, um sie alle zu lösen  von Kostenüberschreitungen bis hin zu regionalen Blockaden, von unterbrochenen OAuth-Flüssen bis hin zu Protokollvorgängen und Unternehmensbeobachtbarkeit.

<Details>
<summary><b>💸 1. „Ich bezahle ein teures Abonnement, werde aber trotzdem durch Limits unterbrochen“</b></summary>

Entwickler zahlen 20200 US-Dollar/Monat für Claude Pro, Codex Pro oder GitHub Copilot. Auch wenn das Kontingent bezahlt wird, gibt es eine Obergrenze  5 Stunden Nutzung, wöchentliche Limits oder Tariflimits pro Minute. Während der Codierungssitzung reagiert der Anbieter nicht mehr und der Entwickler verliert an Fluss und Produktivität.

**So löst OmniRoute das Problem:**

-**Intelligenter 4-Stufen-Fallback** Wenn das Abonnementkontingent aufgebraucht ist, wird automatisch zu API Key → Günstig → Kostenlos weitergeleitet, ohne dass ein manueller Eingriff erforderlich ist
-**Verfolgung von Anbieterlimits** Zwischengespeicherte Kontingent-Snapshots werden nach einem serverseitigen Zeitplan aktualisiert (Standard „PROVIDER_LIMITS_SYNC_INTERVAL_MINUTES=70“), wobei eine manuelle Aktualisierung in der Benutzeroberfläche verfügbar ist
-**Unterstützung mehrerer Konten** Mehrere Konten pro Anbieter mit automatischem Round-Robin  wenn eines aufgebraucht ist, wird zum nächsten gewechselt
-**Benutzerdefinierte Kombinationen** Anpassbare Fallback-Ketten mit 9 Ausgleichsstrategien (Priorität, gewichtet, Fill-First, Round-Robin, P2C, zufällig, am wenigsten genutzt, kostenoptimiert, strikt zufällig)
-**Codex Business Quotas** Überwachung der Geschäfts-/Team-Arbeitsbereichskontingente direkt im Dashboard</details>

<Details>
<summary><b>🔌 2. „Ich muss mehrere Anbieter nutzen, aber jeder hat eine andere API“</b></summary>

OpenAI verwendet ein Format, Claude (Anthropic) verwendet ein anderes, Gemini noch ein anderes. Wenn ein Entwickler Modelle verschiedener Anbieter testen oder zwischen ihnen wechseln möchte, muss er SDKs neu konfigurieren, Endpunkte ändern und mit inkompatiblen Formaten umgehen. Benutzerdefinierte Anbieter (FriendLI, NIM) verfügen über nicht standardmäßige Modellendpunkte.

**So löst OmniRoute das Problem:**

-**Unified Endpoint** Ein einzelner „http://localhost:20128/v1“ dient als Proxy für alle über 60 Anbieter
-**Formatübersetzung** Automatisch und transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
-**Antwortbereinigung** Entfernt nicht standardmäßige Felder („x_groq“, „usage_breakdown“, „service_tier“), die OpenAI SDK v1.83+ beschädigen
-**Rollennormalisierung** Konvertiert „Entwickler“ → „System“ für Nicht-OpenAI-Anbieter; „System“ → „Benutzer“ für GLM/ERNIE
-**Think Tag Extraction** Extrahiert „<think>“-Blöcke aus Modellen wie DeepSeek R1 in standardisierten „reasoning_content“.
-**Strukturierte Ausgabe für Gemini** automatische Konvertierung von „json_schema“ → „responseMimeType“/„responseSchema“.
-**`stream` ist standardmäßig auf `false`**— Entspricht der OpenAI-Spezifikation und vermeidet unerwartetes SSE in Python/Rust/Go-SDKs</details>

<Details>
<summary><b>🌐 3. „Mein KI-Anbieter blockiert meine Region/mein Land“</b></summary>

Anbieter wie OpenAI/Codex blockieren den Zugriff aus bestimmten geografischen Regionen. Benutzer erhalten bei OAuth- und API-Verbindungen Fehlermeldungen wie „unsupported_country_region_territory“. Dies ist besonders frustrierend für Entwickler aus Entwicklungsländern.

**So löst OmniRoute das Problem:**

-**3-Level-Proxy-Konfiguration** Konfigurierbarer Proxy auf 3 Ebenen: global (gesamter Datenverkehr), pro Anbieter (nur ein Anbieter) und pro Verbindung/Schlüssel
-**Farbcodierte Proxy-Abzeichen** Visuelle Indikatoren: 🟢 globaler Proxy, 🟡 Anbieter-Proxy, 🔵 Verbindungs-Proxy, immer mit IP-Adresse
-**OAuth-Token-Austausch über Proxy** Der OAuth-Fluss läuft auch über den Proxy und löst „unsupported_country_region_territory“.
-**Verbindungstests über Proxy** Verbindungstests verwenden den konfigurierten Proxy (keine direkte Umgehung mehr)
-**SOCKS5-Unterstützung** Vollständige SOCKS5-Proxy-Unterstützung für ausgehendes Routing
-**TLS-Fingerabdruck-Spoofing** Browserähnlicher TLS-Fingerabdruck über „wreq-js“, um die Bot-Erkennung zu umgehen
-**🔏 CLI-Fingerabdruck-Abgleich** Ordnet Header und Textfelder neu an, damit sie mit nativen CLI-Binärsignaturen übereinstimmen, wodurch das Risiko der Kontokennzeichnung drastisch reduziert wird. Die Proxy-IP bleibt erhalten  Sie erhalten gleichzeitig Stealth**und**IP-Maskierung</details>

<Details>
<summary><b>🆓 4. „Ich möchte KI zum Codieren verwenden, habe aber kein Geld“</b></summary>

Nicht jeder kann 20200 $/Monat für KI-Abonnements bezahlen. Studenten, Entwickler aus Schwellenländern, Bastler und Freiberufler benötigen Zugang zu hochwertigen Modellen zum Nulltarif.

**So löst OmniRoute das Problem:**

-**Integrierte Free-Tier-Anbieter** Native Unterstützung für 100 % kostenlose Anbieter: Qoder (5 unbegrenzte Modelle über OAuth: kimi-k2-thinking, qwen3-coder-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 unbegrenzte Modelle: qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next, vision-model), Kiro (Claude + AWS Builder ID kostenlos), Gemini CLI (180.000 Token/Monat kostenlos)
-**Ollama Cloud** Cloud-gehostete Ollama-Modelle unter „api.ollama.com“ mit kostenloser Stufe „Light-Nutzung“; Verwenden Sie das Präfix „ollamacloud/<model>“.
-**Nur kostenlose Combos** Kette „gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus“ = 0 $/Monat ohne Ausfallzeit
-**NVIDIA NIM Free Access** Entwickler-für immer kostenloser Zugriff auf über 70 Modelle unter build.nvidia.com mit ca. 40 U/min (Umstellung von Credits auf reine Ratenlimits)
-**Kostenoptimierte Strategie** Routing-Strategie, die automatisch den günstigsten verfügbaren Anbieter auswählt</details>

<Details>
<summary><b>🔒 5. „Ich muss mein KI-Gateway vor unbefugtem Zugriff schützen“</b></summary>

Wenn ein KI-Gateway dem Netzwerk (LAN, VPS, Docker) zugänglich gemacht wird, kann jeder mit der Adresse die Token/Kontingente des Entwicklers verbrauchen. Ohne Schutz sind APIs anfällig für Missbrauch, sofortige Injektion und Missbrauch.

**So löst OmniRoute das Problem:**

-**API-Schlüsselverwaltung** Generierung, Rotation und Scoping pro Anbieter mit einer dedizierten „/dashboard/api-manager“-Seite
-**Berechtigungen auf Modellebene** Beschränken Sie API-Schlüssel auf bestimmte Modelle („openai/*“, Platzhaltermuster) mit der Umschaltfunktion „Alle zulassen/Einschränken“.
-**API Endpoint Protection** Erfordert einen Schlüssel für „/v1/models“ und blockiert bestimmte Anbieter aus der Liste
-**Auth Guard + CSRF-Schutz** Alle Dashboard-Routen sind mit „withAuth“-Middleware + CSRF-Tokens geschützt
-**Ratenbegrenzer** Ratenbegrenzung pro IP mit konfigurierbaren Fenstern
-**IP-Filterung** Zulassungs-/Blockierungsliste für die Zugriffskontrolle
-**Prompt Injection Guard** Bereinigung gegen bösartige Eingabeaufforderungsmuster
-**AES-256-GCM-Verschlüsselung** Anmeldeinformationen im Ruhezustand verschlüsselt</details>

<Details>
<summary><b>🛑 6. „Mein Provider ist ausgefallen und ich habe meinen Programmierfluss verloren“</b></summary>

KI-Anbieter können instabil werden, 5xx-Fehler zurückgeben oder vorübergehende Ratengrenzen erreichen. Wenn ein Entwickler von einem einzelnen Anbieter abhängig ist, wird er unterbrochen. Ohne Schutzschalter können wiederholte Versuche zum Absturz der Anwendung führen.

**So löst OmniRoute das Problem:**

-**Leistungsschalter pro Modell** Automatisches Öffnen/Schließen mit konfigurierbaren Schwellenwerten und Abklingzeit (Geschlossen/Offen/Halboffen), je nach Modell, um kaskadierende Blöcke zu vermeiden
-**Exponentielles Backoff** Progressive Wiederholungsverzögerungen
-**Anti-Thundering Herd** Mutex + Semaphor-Schutz gegen gleichzeitige Wiederholungsstürme
-**Combo-Fallback-Ketten** Wenn der primäre Anbieter ausfällt, fällt er automatisch durch die Kette, ohne dass ein Eingreifen erforderlich ist
-**Combo Circuit Breaker** Deaktiviert automatisch ausgefallene Anbieter innerhalb einer Combo-Kette
-**Gesundheits-Dashboard** Betriebszeitüberwachung, Leistungsschalterzustände, Sperren, Cache-Statistiken, p50/p95/p99-Latenz</details>

<Details>
<summary><b>🔧 7. „Die Konfiguration jedes KI-Tools ist mühsam und repetitiv“</b></summary>

Entwickler verwenden Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code ... Jedes Tool benötigt eine andere Konfiguration (API-Endpunkt, Schlüssel, Modell). Eine Neukonfiguration bei einem Anbieter- oder Modellwechsel ist Zeitverschwendung.

**So löst OmniRoute das Problem:**

-**CLI Tools Dashboard** Spezielle Seite mit Ein-Klick-Einrichtung für Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
-**GitHub Copilot Config Generator** Erzeugt „chatLanguageModels.json“ für VS-Code mit Massenmodellauswahl
-**Onboarding-Assistent** Geführte Einrichtung in 4 Schritten für Erstbenutzer
-**Ein Endpunkt, alle Modelle** Konfigurieren Sie „http://localhost:20128/v1“ einmal und greifen Sie auf über 60 Anbieter zu</details>

<Details>
<summary><b>🔑 8. „Die Verwaltung von OAuth-Tokens von mehreren Anbietern ist die Hölle“</b></summary>

Claude Code, Codex, Gemini CLI, Copilot  alle verwenden OAuth 2.0 mit ablaufenden Token. Entwickler müssen sich ständig neu authentifizieren, sich mit „client_secret fehlt“, „redirect_uri_mismatch“ und Fehlern auf Remote-Servern befassen. Besonders problematisch ist OAuth auf LAN/VPS.

**So löst OmniRoute das Problem:**

-**Automatische Token-Aktualisierung** OAuth-Tokens werden vor Ablauf im Hintergrund aktualisiert
-**OAuth 2.0 (PKCE) integriert** Automatischer Ablauf für Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, Qoder
-**Multi-Account OAuth** Mehrere Konten pro Anbieter über JWT/ID-Token-Extraktion
-**OAuth LAN/Remote Fix** Private IP-Erkennung für „redirect_uri“ + manueller URL-Modus für Remote-Server
-**OAuth hinter Nginx** Verwendet „window.location.origin“ für Reverse-Proxy-Kompatibilität
-**Remote OAuth Guide** Schritt-für-Schritt-Anleitung für Google Cloud-Anmeldeinformationen auf VPS/Docker</details>

<Details>
<summary><b>📊 9. „Ich weiß nicht, wie viel ich wo ausgebe“</b></summary>

Entwickler nutzen mehrere kostenpflichtige Anbieter, haben jedoch keine einheitliche Sicht auf die Ausgaben. Jeder Anbieter verfügt über ein eigenes Abrechnungs-Dashboard, es gibt jedoch keine konsolidierte Ansicht. Unerwartete Kosten können sich häufen.

**So löst OmniRoute das Problem:**

-**Kostenanalyse-Dashboard** Kostenverfolgung pro Token und Budgetverwaltung pro Anbieter
-**Budgetgrenzen pro Stufe** Ausgabenobergrenze pro Stufe, die einen automatischen Fallback auslöst
-**Preiskonfiguration pro Modell** Konfigurierbare Preise pro Modell
-**Nutzungsstatistiken pro API-Schlüssel** Anzahl der Anfragen und zuletzt verwendeter Zeitstempel pro Schlüssel
-**Analytics-Dashboard** Statistikkarten, Modellnutzungsdiagramm, Anbietertabelle mit Erfolgsraten und Latenz</details>

<Details>
<summary><b>🐛 10. „Ich kann Fehler und Probleme bei KI-Aufrufen nicht diagnostizieren“</b></summary>

Wenn ein Anruf fehlschlägt, weiß der Entwickler nicht, ob es sich um eine Ratenbegrenzung, ein abgelaufenes Token, ein falsches Format oder einen Anbieterfehler handelt. Fragmentierte Protokolle über verschiedene Terminals hinweg. Ohne Beobachtbarkeit ist das Debuggen ein Versuch und Irrtum.

**So löst OmniRoute das Problem:**

-**Einheitliches Protokoll-Dashboard** 4 Registerkarten: Anforderungsprotokolle, Proxy-Protokolle, Audit-Protokolle, Konsole
-**Console Log Viewer** Echtzeit-Viewer im Terminal-Stil mit farbcodierten Ebenen, automatischem Scrollen, Suche und Filter
-**SQLite-Proxy-Protokolle** Persistente Protokolle, die Serverneustarts überdauern
-**Translator Playground** 4 Debugging-Modi: Playground (Formatübersetzung), Chat Tester (Round-Trip), Test Bench (Batch), Live Monitor (Echtzeit)
-**Telemetrie anfordern** p50/p95/p99-Latenz + X-Request-Id-Ablaufverfolgung
-**Dateibasierte Protokollierung mit Rotation** App-Protokolle rotieren nach Größe, Aufbewahrungstagen und Archivanzahl; Anrufprotokollartefakte rotieren nach Aufbewahrungstagen und Dateianzahl
-**Systeminfobericht** „npm run system-info“ generiert „system-info.txt“ mit Ihrer vollständigen Umgebung (Knotenversion, OmniRoute-Version, Betriebssystem, CLI-Tools, Docker/PM2-Status). Hängen Sie es an, wenn Sie Probleme melden, um eine sofortige Einstufung zu ermöglichen.</details>

<Details>
<summary><b>🏗️ 11. „Die Bereitstellung und Wartung des Gateways ist komplex“</b></summary>

Die Installation, Konfiguration und Wartung eines KI-Proxys in verschiedenen Umgebungen (lokal, VPS, Docker, Cloud) ist arbeitsintensiv. Probleme wie hartcodierte Pfade, „EACCES“ für Verzeichnisse, Portkonflikte und plattformübergreifende Builds sorgen für zusätzliche Reibung.

**So löst OmniRoute das Problem:**

-**npm globale Installation** „npm install -g omniroute && omniroute“  fertig
-**Docker Multi-Platform** AMD64 + ARM64 nativ (Apple Silicon, AWS Graviton, Raspberry Pi)
-**Docker Compose-Profile** „base“ (keine CLI-Tools) und „cli“ (mit Claude Code, Codex, OpenClaw)
-**Electron Desktop App** Native App für Windows/macOS/Linux mit Taskleiste, Autostart, Offline-Modus
-**Split-Port-Modus** API und Dashboard auf separaten Ports für erweiterte Szenarien (Reverse-Proxy, Container-Netzwerk)
-**Cloud Sync** Konfigurieren Sie die geräteübergreifende Synchronisierung über Cloudflare Workers
-**DB-Backups** Automatische Sicherung, Wiederherstellung, Export und Import aller Einstellungen, mit „DISABLE_SQLITE_AUTO_BACKUP“ für extern verwaltete Backups</details>

<Details>
<summary><b>🌍 12. „Die Benutzeroberfläche ist nur auf Englisch verfügbar und mein Team spricht kein Englisch“</b></summary>

Teams in nicht englischsprachigen Ländern, insbesondere in Lateinamerika, Asien und Europa, haben Probleme mit rein englischsprachigen Benutzeroberflächen. Sprachbarrieren verringern die Akzeptanz und erhöhen die Zahl von Konfigurationsfehlern.

**So löst OmniRoute das Problem:**

-**Dashboard i18n  30 Sprachen** Alle über 500 Tasten übersetzt, einschließlich Arabisch, Bulgarisch, Dänisch, Deutsch, Spanisch, Finnisch, Französisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch (PT/BR), Rumänisch, Russisch, Slowakisch, Schwedisch, Thailändisch, Ukrainisch, Vietnamesisch, Chinesisch, Philippinisch, Englisch
-**RTL-Unterstützung** Rechts-nach-links-Unterstützung für Arabisch und Hebräisch
-**Mehrsprachige READMEs** 30 vollständige Dokumentationsübersetzungen
-**Sprachauswahl** Globussymbol in der Kopfzeile zum Umschalten in Echtzeit</details>

<Details>
<summary><b>🔄 13. „Ich brauche mehr als nur Chat  ich brauche Einbettungen, Bilder, Audio“</b></summary>

KI ist nicht nur der Abschluss eines Chats. Entwickler müssen Bilder generieren, Audio transkribieren, Einbettungen für RAG erstellen, Dokumente neu einordnen und Inhalte moderieren. Jede API hat einen anderen Endpunkt und ein anderes Format.

**So löst OmniRoute das Problem:**

-**Embeddings** „/v1/embeddings“ mit 6 Anbietern und 9+ Modellen
-**Image Generation** „/v1/images/generations“ mit 10 Anbietern und über 20 Modellen (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
-**Text-zu-Video** „/v1/videos/generations“  ComfyUI (AnimateDiff, SVD) und SD WebUI
-**Text-zu-Musik** „/v1/music/generations“  ComfyUI (Stable Audio Open, MusicGen)
-**Audiotranskription** „/v1/audio/transcriptions“  Whisper + Nvidia NIM, HuggingFace, Qwen3
-**Text-to-Speech** „/v1/audio/speech“  ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3,**Inworld**,**Cartesia**,**PlayHT**, + bestehende Anbieter
-**Moderationen** „/v1/moderations“  Überprüfung der Inhaltssicherheit
-**Reranking** „/v1/rerank“  Neuranking der Dokumentrelevanz
-**Responses API** Vollständige „/v1/responses“-Unterstützung für Codex</details>

<Details>
<summary><b>🧪 14. „Ich habe keine Möglichkeit, die Qualität verschiedener Modelle zu testen und zu vergleichen“</b></summary>

Entwickler möchten wissen, welches Modell für ihren Anwendungsfall am besten geeignet ist  Code, Übersetzung, Argumentation , aber ein manueller Vergleich ist langsam. Es sind keine integrierten Evaluierungstools vorhanden.

**So löst OmniRoute das Problem:**

-**LLM-Bewertungen** Golden-Set-Test mit 10 vorinstallierten Fällen zu Begrüßungen, Mathematik, Geografie, Codegenerierung, JSON-Konformität, Übersetzung, Markdown und Sicherheitsverweigerung
-**4 Match-Strategien** „exact“, „contains“, „regex“, „custom“ (JS-Funktion)
-**Translator Playground Test Bench** Batch-Tests mit mehreren Eingaben und erwarteten Ausgaben, anbieterübergreifender Vergleich
-**Chat-Tester** Vollständiger Roundtrip mit visueller Antwortwiedergabe
-**Live-Monitor** Echtzeit-Stream aller Anfragen, die über den Proxy fließen</details>

<Details>
<summary><b>📈 15. „Ich muss skalieren, ohne an Leistung einzubüßen“</b></summary>

Wenn das Anfragevolumen wächst, verursachen dieselben Fragen ohne Zwischenspeicherung doppelte Kosten. Ohne Idempotenz verschwenden doppelte Anfragen die Verarbeitung. Die Tarifbegrenzungen pro Anbieter müssen eingehalten werden.

**So löst OmniRoute das Problem:**

-**Semantischer Cache** Zweistufiger Cache (Signatur + Semantik) reduziert Kosten und Latenz
-**Request Idempotency** 5-Sekunden-Deduplizierungsfenster für identische Anfragen
-**Ratenbegrenzungserkennung** Provider-RPM, minimale Lücke und maximale gleichzeitige Verfolgung
-**Bearbeitbare Ratengrenzen** Konfigurierbare Standardeinstellungen unter Einstellungen → Ausfallsicherheit mit Persistenz
-**API Key Validation Cache** 3-stufiger Cache für Produktionsleistung
-**Gesundheits-Dashboard mit Telemetrie** p50/p95/p99-Latenz, Cache-Statistiken, Betriebszeit</details>

<Details>
<summary><b>🤖 16. „Ich möchte das Modellverhalten global steuern“</b></summary>

Entwickler, die alle Antworten in einer bestimmten Sprache oder mit einem bestimmten Ton wünschen oder die Argumentationstoken einschränken möchten. Dies in jedem Tool/jeder Anfrage zu konfigurieren, ist unpraktisch.

**So löst OmniRoute das Problem:**

-**System Prompt Injection** Globale Eingabeaufforderung, die auf alle Anfragen angewendet wird
-**Thinking Budget Validation** Reasoning-Token-Zuteilungskontrolle pro Anfrage (Passthrough, automatisch, benutzerdefiniert, adaptiv)
-**9 Routing-Strategien** Globale Strategien, die bestimmen, wie Anfragen verteilt werden
-**Wildcard-Router** „provider/*“-Muster leiten dynamisch an jeden Anbieter weiter
-**Combo-Aktivierung/Deaktivierung umschalten** Combos direkt über das Dashboard umschalten
-**Provider Toggle** Alle Verbindungen für einen Anbieter mit einem Klick aktivieren/deaktivieren
-**Blockierte Anbieter** Bestimmte Anbieter aus der Liste „/v1/models“ ausschließen</details>

<Details>
<summary><b>🧰 17. „Ich brauche MCP-Tools als erstklassige Produktfunktionen“</b></summary>

Viele KI-Gateways stellen MCP nur als verstecktes Implementierungsdetail zur Verfügung. Teams benötigen eine sichtbare, überschaubare Betriebsebene.

**So löst OmniRoute das Problem:**

 MCP wird in der Dashboard-Navigation und auf der Registerkarte „Endpunktprotokoll“ angezeigt
- Dedizierte MCP-Verwaltungsseite mit Prozess, Tools, Bereichen und Audit
 Integrierter Schnellstart für „omniroute --mcp“ und Client-Onboarding</details>

<Details>
<summary><b>🧠 18. „Ich benötige A2A-Orchestrierung mit Synchronisierungs- und Stream-Aufgabenpfaden“</b></summary>

Agenten-Workflows erfordern sowohl direkte Antworten als auch eine lang andauernde gestreamte Ausführung mit Lebenszykluskontrolle.

**So löst OmniRoute das Problem:**

- A2A JSON-RPC-Endpunkt („POST /a2a“) mit „message/send“ und „message/stream“.
- SSE-Streaming mit Terminal-State-Propagierung
 Task-Lebenszyklus-APIs für „tasks/get“ und „tasks/cancel“.</details>

<Details>
<summary><b>🛰️ 19. „Ich brauche einen echten Zustand des MCP-Prozesses, keinen erratenen Status“</b></summary>

Betriebsteams müssen wissen, ob MCP tatsächlich aktiv ist, und nicht nur, ob eine API erreichbar ist.

**So löst OmniRoute das Problem:**

 Laufzeit-Heartbeat-Datei mit PID, Zeitstempeln, Transport, Werkzeuganzahl und Oszilloskopmodus
- MCP-Status-API, die Heartbeat + aktuelle Aktivität kombiniert
- UI-Statuskarten für Prozess-/Verfügbarkeits-/Heartbeat-Aktualität</details>

<Details>
<summary><b>📋 20. „Ich benötige eine überprüfbare MCP-Tool-Ausführung“</b></summary>

Wenn Tools die Konfiguration verändern oder operative Aktionen auslösen, benötigen Teams forensische Rückverfolgbarkeit.

**So löst OmniRoute das Problem:**

 SQLite-gestützte Audit-Protokollierung für MCP-Tool-Aufrufe
- Filtert nach Tool, Erfolg/Misserfolg, API-Schlüssel und Paginierung
- Dashboard-Audit-Tabelle + Statistik-Endpunkte für die Automatisierung</details>

<Details>
<summary><b>🔐 21. „Ich benötige bereichsbezogene MCP-Berechtigungen pro Integration“</b></summary>

Verschiedene Clients sollten Zugriff auf die Werkzeugkategorien mit den geringsten Rechten haben.

**So löst OmniRoute das Problem:**

- 10 granulare MCP-Bereiche für kontrollierten Werkzeugzugriff
- Geltungsbereichsdurchsetzung und Sichtbarkeit in der MCP-Management-Benutzeroberfläche
- Sichere Standardhaltung für Betriebswerkzeuge</details>

<Details>
<summary><b>⚙️ 22. „Ich brauche Betriebskontrollen ohne Umschichtung“</b></summary>

Teams benötigen bei Vorfällen oder Kostenereignissen schnelle Laufzeitänderungen.

**So löst OmniRoute das Problem:**

- Schalten Sie die Combo-Aktivierung direkt über das MCP-Dashboard um
- Wenden Sie Ausfallsicherheitsprofile aus vordefinierten Richtlinienpaketen an
- Setzen Sie den Leistungsschalterstatus über dasselbe Bedienfeld zurück</details>

<Details>
<summary><b>🔄 23. „Ich benötige Live-Sichtbarkeit und Stornierung des A2A-Aufgabenlebenszyklus“</b></summary>

Ohne Sichtbarkeit des Lebenszyklus wird es schwierig, Aufgabenvorfälle zu selektieren.

**So löst OmniRoute das Problem:**

- Aufgabenliste/Filterung nach Bundesland/Fähigkeit mit Paginierung
- Drilldown zu Aufgabenmetadaten, Ereignissen und Artefakten
- Endpunkt zum Abbrechen von Aufgaben und UI-Aktion mit Bestätigung</details>

<Details>
<summary><b>🌊 24. „Ich benötige aktive Stream-Metriken für die A2A-Last“</b></summary>

Streaming-Workflows erfordern betriebliche Einblicke in Parallelität und Live-Verbindungen.

**So löst OmniRoute das Problem:**

- Aktive Stream-Zähler im A2A-Status integriert
- Zeitstempel der letzten Aufgabe und Anzahl pro Status
- A2A-Dashboard-Karten für die Echtzeit-Betriebsüberwachung</details>

<Details>
<summary><b>🪪 25. „Ich benötige eine standardmäßige Agentenerkennung für Kunden“</b></summary>

Externe Kunden und Orchestratoren benötigen für das Onboarding maschinenlesbare Metadaten.

**So löst OmniRoute das Problem:**

 Agentenkarte unter „/.well-known/agent.json“ verfügbar gemacht
- Fähigkeiten und Fertigkeiten werden in der Management-Benutzeroberfläche angezeigt
 Die A2A-Status-API enthält Erkennungsmetadaten für die Automatisierung</details>

<Details>
<summary><b>🧭 26. „Ich benötige Protokollauffindbarkeit in der Produkt-UX“</b></summary>

Wenn Benutzer Protokolloberflächen nicht entdecken können, sinken Akzeptanz und Supportqualität.

**So löst OmniRoute das Problem:**

- Konsolidierte Seite**Endpunkte**mit Registerkarten für Proxy-, MCP-, A2A- und API-Endpunkte
- Inline-Dienststatusumschaltung (Online/Offline) für MCP und A2A
- Links von der Übersicht zu speziellen Verwaltungsregisterkarten</details>

<Details>
<summary><b>🧪 27. „Ich benötige eine End-to-End-Protokollvalidierung mit echten Clients“</b></summary>

Probetests reichen nicht aus, um die Protokollkompatibilität vor der Veröffentlichung zu überprüfen.

**So löst OmniRoute das Problem:**

 E2E-Suite, die die App startet und echten MCP SDK-Client-Transport verwendet
- A2A-Clienttests für Erkennungs-, Sende-, Stream-, Get- und Abbruchflüsse
- Vergleichen Sie Behauptungen mit MCP-Audit- und A2A-Aufgaben-APIs</details>

<Details>
<summary><b>📡 28. „Ich brauche eine einheitliche Beobachtbarkeit über alle Schnittstellen hinweg“</b></summary>

Die Aufteilung der Beobachtbarkeit nach Protokoll führt zu blinden Flecken und einer längeren MTTR.

**So löst OmniRoute das Problem:**

- Einheitliche Dashboards/Protokolle/Analysen in einem Produkt
- Gesundheits-, Audit- und Anforderungstelemetrie über OpenAI-, MCP- und A2A-Ebenen hinweg
- Operative APIs für Status und Automatisierung</details>

<Details>
<summary><b>💼 29. „Ich benötige eine Laufzeit für Proxy + Tools + Agent-Orchestrierung“</b></summary>

Die Ausführung vieler separater Dienste erhöht die Betriebskosten und erhöht die Fehlerhäufigkeit.

**So löst OmniRoute das Problem:**

- OpenAI-kompatibler Proxy, MCP-Server und A2A-Server in einem Stack
 Gemeinsame Authentifizierung, Ausfallsicherheit, Datenspeicher und Beobachtbarkeit
- Konsistentes Richtlinienmodell über alle Interaktionsoberflächen hinweg</details>

<Details>
<summary><b>🚀 30. „Ich muss Agenten-Workflows ohne Glue-Code-Wildwuchs ausliefern“</b></summary>

Teams verlieren an Geschwindigkeit, wenn sie mehrere Ad-hoc-Dienste und -Skripte zusammenfügen.

**So löst OmniRoute das Problem:**

- Einheitliche Endpunktstrategie für Kunden und Agenten
- Integrierte Protokollverwaltungs-Benutzeroberflächen und Rauchvalidierungspfade
- Produktionsreife Grundlagen (Sicherheit, Protokollierung, Ausfallsicherheit, Backup)</details>

### Example Playbooks (Integrated Use Cases)

**Playbook A: Bezahltes Abonnement maximieren + günstiges Backup**```txt
Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption

Playbook B: Kostenfreier Codierungsstack```txt Combo: "free-forever"

  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0 Outcome: stable free coding workflow


**Playbook C: 24/7 Always-On-Fallback-Kette**```txt
Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads

Playbook D: Agenteneinsätze mit MCP + A2A```txt

  1. Start MCP transport (omniroute --mcp) for tool-driven operations
  2. Run A2A tasks via message/send and message/stream
  3. Observe via /dashboard/endpoint (MCP and A2A tabs)
  4. Toggle services via inline status controls

---

## 🆓 Start Free — Zero Configuration Cost

> Richten Sie die KI-Codierung in wenigen Minuten für**0 $/Monat**ein. Verbinden Sie diese kostenlosen Konten und nutzen Sie die integrierte**Free Stack**-Kombination.

| Schritt | Aktion | Anbieter freigeschaltet |
| ---- | ------------------------------------------------- | ----------------------------------------------------------------- |
| 1 | Verbinden Sie**Kiro**(AWS Builder ID OAuth) | Claude Sonnet 4.5, Haiku 4.5 **unbegrenzt**|
| 2 | Verbinden Sie**Qoder**(Google OAuth) | kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... —**unbegrenzt**|
| 3 | Verbinden Sie**Qwen**(Gerätecode) | qwen3-coder-plus, qwen3-coder-flash... —**unbegrenzt**|
| 4 | Verbinden Sie**Gemini CLI**(Google OAuth) | gemini-3-flash, gemini-2.5-pro **180.000/Monat kostenlos**|
| 5 | `/dashboard/combos` → Vorlage**Free Stack ($0)**| Round-Robin aller kostenlosen Anbieter automatisch |

**Zeigen Sie eine beliebige IDE/CLI auf:**„http://localhost:20128/v1“ · API-Schlüssel: „any-string“ · Fertig.

>**Optionale zusätzliche Abdeckung (auch kostenlos):**Groq API-Schlüssel (30 U/min kostenlos), NVIDIA NIM (40 U/min kostenlos, 70+ Modelle), Cerebras (1 Mio. Token/Tag), LongCat API-Schlüssel (50 Mio. Token/Tag!), Cloudflare Workers AI (10.000 Neuronen/Tag, 50+ Modelle).## Schnellstart

### 1) Install and run

```bash
npm install -g omniroute
omniroute

**pnpm-Benutzer:**Führen Sie nach der Installation „pnpm genehmigt-builds -g“ aus, um native Build-Skripte zu aktivieren, die für „better-sqlite3“ und „@swc/core“ erforderlich sind:

„Bash pnpm install -g omniroute pnpm genehmigt-builds -g # Alle Pakete auswählen → genehmigen Omniroute


Das Dashboard wird unter „http://localhost:20128“ geöffnet und die API-Basis-URL ist „http://localhost:20128/v1“.

Befehl Beschreibung
omniroute Server starten („PORT=20128“, API und Dashboard auf demselben Port)
omniroute --port 3000 Setzen Sie den kanonischen/API-Port auf 3000
omniroute --mcp Starten Sie den MCP-Server (STDIO-Transport)
omniroute --no-open Browser nicht automatisch öffnen
omniroute --help Hilfe anzeigen

Optionaler Split-Port-Modus:```bash PORT=20128 DASHBOARD_PORT=20129 omniroute

API: http://localhost:20128/v1

Dashboard: http://localhost:20129


### Long-Running Streaming Timeouts

Für die meisten Bereitstellungen benötigen Sie lediglich:

| Variable | Standard | Zweck |
| ------------------------ | -------------- | ---------------------------------------------------------------------------------------------- |
| `REQUEST_TIMEOUT_MS` | „600000“ | Gemeinsame Baseline für Upstream-Abruf, versteckte Undici-Timeouts, TLS-Fingerprint-Anfragen und API-Bridge-Request/Proxy-Timeouts |
| `STREAM_IDLE_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ | Maximale Lücke zwischen Streaming-Blöcken, bevor OmniRoute den SSE-Stream abbricht |

Die Abwärtskompatibilität bleibt erhalten: Vorhandene „FETCH_TIMEOUT_MS“, „API_BRIDGE_PROXY_TIMEOUT_MS“ und andere Timeout-Variablen pro Ebene funktionieren weiterhin und überschreiben die gemeinsame Baseline.

Wenn Sie eine genauere Steuerung benötigen, stehen erweiterte Überschreibungen zur Verfügung:| Variable | Standard | Zweck |
| ---------------------------------------- | ------------------------------------------ | ------------------------------------------------------------------- |
| `FETCH_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ | Gesamtzeitüberschreitung der Upstream-Anforderung, die vom Hauptabrufsignal | verwendet wird
| `FETCH_HEADERS_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Undici-Zeitlimit für den Empfang von Upstream-Antwortheadern |
| `FETCH_BODY_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Undici-Zeitlimit zwischen Upstream-Body-Chunks („0“ deaktiviert es) |
| `FETCH_CONNECT_TIMEOUT_MS` | „30000“ | Undici TCP-Verbindungszeitüberschreitung |
| `FETCH_KEEPALIVE_TIMEOUT_MS` | „4000“ | Undici Leerlauf-Keep-Alive-Socket-Timeout |
| `TLS_CLIENT_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Zeitüberschreitung für TLS-Fingerabdruckanfragen über „wreq-js“ |
| `API_BRIDGE_PROXY_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ oder „30000“ | Zeitüberschreitung für „/v1“-Proxy-Weiterleitung vom API-Port zum Dashboard-Port |
| `API_BRIDGE_SERVER_REQUEST_TIMEOUT_MS` | `max(API_BRIDGE_PROXY_TIMEOUT_MS, 300000)` | Zeitüberschreitung bei eingehenden Anfragen auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_HEADERS_TIMEOUT_MS` | „60000“ | Zeitüberschreitung beim eingehenden Header auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_KEEPALIVE_TIMEOUT_MS` | „5000“ | Keep-Alive-Timeout auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_SOCKET_TIMEOUT_MS` | `0` | Zeitüberschreitung bei Socket-Inaktivität auf dem API-Bridge-Server („0“ deaktiviert ihn) |

Wenn Sie OmniRoute hinter Nginx, Caddy, Cloudflare oder einem anderen Reverse-Proxy ausführen, stellen Sie sicher, dass der Proxy vorhanden ist
Die Zeitüberschreitungen sind auch höher als die Zeitüberschreitungen für Ihren OmniRoute-Stream/Abruf.### 2) Connect providers and create your API key

1. Öffnen Sie Dashboard → „Anbieter“ und verbinden Sie mindestens einen Anbieter (OAuth oder API-Schlüssel).
2. Öffnen Sie Dashboard → „Endpunkte“ und erstellen Sie einen API-Schlüssel.
3. (Optional) Öffnen Sie Dashboard → „Combos“ und legen Sie Ihre Fallback-Kette fest.### 3) Point your coding tool to OmniRoute

```txt
Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)

Funktioniert mit Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode und OpenAI-kompatiblen SDKs.### 4) Enable and validate protocols (v2.0)

MCP (für werkzeuggesteuerte Vorgänge):```bash omniroute --mcp


Verbinden Sie dann Ihren MCP-Client über „stdio“ und testen Sie Tools wie:

- `omniroute_get_health`
- `omniroute_list_combos`

**A2A (für Agent-zu-Agent-Workflows):**```bash
curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
npm run test:protocols:e2e

Diese Suite validiert echte MCP- und A2A-Client-Flows anhand einer laufenden App.### Alternative: run from source

cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev
Void Linux (Vorlage „xbps-src“)

Für Void-Linux-Benutzer können Sie mit „xbps-src“ ein natives Paket erstellen. Speichern Sie diesen Block als „srcpkgs/omniroute/template“:```bash

Template file for 'omniroute'

pkgname=omniroute version=3.4.1 revision=1 hostmakedepends="nodejs python3 make" depends="openssl" short_desc="Universal AI gateway with smart routing for multiple LLM providers" maintainer="zenobit zenobit@disroot.org" license="MIT" homepage="https://github.com/diegosouzapw/OmniRoute" distfiles="https://github.com/diegosouzapw/OmniRoute/archive/refs/tags/v${version}.tar.gz" checksum=009400afee90a9f32599d8fe734145cfd84098140b7287990183dde45ae2245b system_accounts="_omniroute" omniroute_homedir="/var/lib/omniroute" export NODE_ENV=production export npm_config_engine_strict=false export npm_config_loglevel=error export npm_config_fund=false export npm_config_audit=false

do_build() { # Determine target CPU arch for node-gyp local _gyp_arch case "$XBPS_TARGET_MACHINE" in aarch64*) _gyp_arch=arm64 ;; armv7*|armv6*) _gyp_arch=arm ;; i686*) _gyp_arch=ia32 ;; *) _gyp_arch=x64 ;; esac

# 1) Install all deps  skip scripts (no network in do_build, native modules
#    compiled separately below; better-sqlite3 is serverExternalPackage so
#    Next.js does not execute it during next build)
NODE_ENV=development npm ci --ignore-scripts

# 2) Build the Next.js standalone bundle
npm run build

# 3) Copy static assets into standalone
cp -r .next/static .next/standalone/.next/static
[ -d public ] && cp -r public .next/standalone/public || true

# 4) Compile better-sqlite3 native binding for the target architecture.
#    Use node-gyp directly so CC/CXX from xbps-src cross-toolchain are used
#    without npm altering them.
local _node_gyp=/usr/lib/node_modules/npm/node_modules/node-gyp/bin/node-gyp.js
(cd node_modules/better-sqlite3 && node "$_node_gyp" rebuild --arch="$_gyp_arch")

# 5) Place the compiled binding into the standalone bundle
local _bs3_release=.next/standalone/node_modules/better-sqlite3/build/Release
mkdir -p "$_bs3_release"
cp node_modules/better-sqlite3/build/Release/better_sqlite3.node "$_bs3_release/"

# 6) Remove arch-specific sharp bundles  upstream sets images.unoptimized=true
#    so sharp is not used at runtime; x64 .so files would break aarch64 strip
rm -rf .next/standalone/node_modules/@img

# 7) Copy pino runtime deps omitted by Next.js static analysis:
#    pino-abstract-transport  required by pino's worker thread
#    split2  dep of pino-abstract-transport
#    process-warning  dep of pino itself
for _mod in pino-abstract-transport split2 process-warning; do
	cp -r "node_modules/$_mod" .next/standalone/node_modules/
done

}

do_check() { npm run test:unit }

do_install() { vmkdir usr/lib/omniroute/.next

vcopy .next/standalone/. usr/lib/omniroute/.next/standalone

# Prevent removal of empty Next.js app router dirs by the post-install hook
for _d in \
	.next/standalone/.next/server/app/dashboard \
	.next/standalone/.next/server/app/dashboard/settings \
	.next/standalone/.next/server/app/dashboard/providers; do
	touch "${DESTDIR}/usr/lib/omniroute/${_d}/.keep"
done

cat > "${WRKDIR}/omniroute" <<'EOF'

#!/bin/sh export PORT="${PORT:-20128}" export DATA_DIR="${DATA_DIR:-${XDG_DATA_HOME:-${HOME}/.local/share}/omniroute}" export LOG_TO_FILE="${LOG_TO_FILE:-false}" mkdir -p "${DATA_DIR}" exec node /usr/lib/omniroute/.next/standalone/server.js "$@" EOF vbin "${WRKDIR}/omniroute" }

post_install() { vlicense LICENSE }


</details>

---

## 🐳 Docker

OmniRoute ist als öffentliches Docker-Image auf [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute) verfügbar.

**Schneller Lauf:**```bash
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --stop-timeout 40 \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Umgebungsdatei:```bash

Copy and edit .env first

cp .env.example .env

docker run -d
--name omniroute
--restart unless-stopped
--stop-timeout 40
--env-file .env
-p 20128:20128
-v omniroute-data:/app/data
diegosouzapw/omniroute:latest


**Verwendung von Docker Compose:**```bash
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d

Die Dashboard-Unterstützung für Docker-Bereitstellungen umfasst jetzt einenCloudflare Quick Tunnelmit einem Klick unter „Dashboard → Endpunkte“. Die erste Aktivierung lädt „cloudflared“ nur bei Bedarf herunter, startet einen temporären Tunnel zu Ihrem aktuellen „/v1“-Endpunkt und zeigt die generierte „https://*.trycloudflare.com/v1“-URL direkt unter Ihrer normalen öffentlichen URL an.

Hinweise:

  • Quick Tunnel-URLs sind temporär und ändern sich nach jedem Neustart. Quick Tunnels werden nach einem OmniRoute- oder Container-Neustart nicht automatisch wiederhergestellt. Aktivieren Sie sie bei Bedarf über das Dashboard erneut. Die verwaltete Installation unterstützt derzeit Linux, macOS und Windows auf „x64“ / „arm64“. Managed Quick Tunnels verwenden standardmäßig den HTTP/2-Transport, um laute QUIC-UDP-Pufferwarnungen in eingeschränkten Containerumgebungen zu vermeiden. Stellen Sie „CLOUDFLARED_PROTOCOL=quic“ oder „auto“ ein, wenn Sie einen anderen Transport wünschen.
  • Docker-Images bündeln System-CA-Roots und übergeben sie an verwaltetes „Cloudflared“, wodurch TLS-Vertrauensfehler vermieden werden, wenn der Tunnel innerhalb des Containers bootet.
  • SQLite läuft im WAL-Modus. „Docker Stop“ sollte abgeschlossen werden dürfen, damit OmniRoute die neuesten Änderungen zurück in „storage.sqlite“ überprüfen kann. Die gebündelten Compose-Dateien legen bereits eine Stoppfrist von 40 Sekunden fest. Wenn Sie das Image direkt ausführen, behalten Sie „--stop-timeout 40“ (oder ähnlich) bei, damit manuelle Stopps die Bereinigung beim Herunterfahren nicht unterbrechen.
  • Legen Sie „CLOUDFLARED_BIN=/absolute/path/to/cloudflared“ fest, wenn OmniRoute eine vorhandene Binärdatei verwenden soll, anstatt eine herunterzuladen.

Verwendung von Docker Compose mit Caddy (HTTPS Auto-TLS):

OmniRoute kann mithilfe der automatischen SSL-Bereitstellung von Caddy sicher verfügbar gemacht werden. Stellen Sie sicher, dass der DNS-A-Eintrag Ihrer Domain auf die IP Ihres Servers verweist.```yaml services: omniroute: image: diegosouzapw/omniroute:latest container_name: omniroute restart: unless-stopped volumes: - omniroute-data:/app/data environment: - PORT=20128 - NEXT_PUBLIC_BASE_URL=https://your-domain.com

caddy: image: caddy:latest container_name: caddy restart: unless-stopped ports: - "80:80" - "443:443" command: caddy reverse-proxy --from https://your-domain.com --to http://omniroute:20128

volumes: omniroute-data:


| Bild | Tag | Größe | Beschreibung |
| ------------------------ | -------- | ------ | --------------------- |
| `diegosouzapw/omniroute` | `neueste` | ~250 MB | Neueste stabile Version |
| `diegosouzapw/omniroute` | `1.0.3` | ~250 MB | Aktuelle Version |---

## 🖥️ Desktop App — Offline & Always-On

> 🆕**NEU!**OmniRoute ist jetzt als**native Desktop-Anwendung**für Windows, macOS und Linux verfügbar.

Führen Sie OmniRoute als eigenständige Desktop-App aus  kein Terminal, kein Browser, keine Internetverbindung für lokale Modelle erforderlich. Die Electron-basierte App umfasst:

- 🖥️**Natives Fenster** Spezielles App-Fenster mit Integration in die Taskleiste
- 🔄**Auto-Start** OmniRoute bei der Systemanmeldung starten
- 🔔**Native Benachrichtigungen** Erhalten Sie Benachrichtigungen bei Kontingentausschöpfung oder Anbieterproblemen
- ⚡**One-Click-Installation** NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐**Offline-Modus** Funktioniert vollständig offline mit dem gebündelten Server### Schnellstart

```bash
# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)

System Tray

Wenn OmniRoute minimiert ist, befindet es sich mit schnellen Aktionen in Ihrer Taskleiste:

  • Dashboard öffnen
  • Server-Port ändern
  • Anwendung beenden

📖 Vollständige Dokumentation: electron/README.md---

💰 Pricing at a Glance

Stufe Anbieter Kosten Kontingent zurücksetzen Am besten für
💳 ABO Claude Code (Pro) 20 $/Monat 5h + wöchentlich Bereits abonniert
Codex (Plus/Pro) 20200 $/Monat 5h + wöchentlich OpenAI-Benutzer
Gemini CLI KOSTENLOS 180.000/Monat + 1.000/Tag Alle!
GitHub-Copilot 1019 $/Monat Monatlich GitHub-Benutzer
🔑 API-SCHLÜSSEL NVIDIA NIM KOSTENLOS(für immer entwickeln) ~40 U/min Über 70 offene Modelle
Großhirn KOSTENLOS(1 Mio. tok/Tag) 60.000 TPM / 30 U/min Der schnellste der Welt
Groq KOSTENLOS(30 U/min) 14,4K RPD Ultraschnelles Lama/Gemma
DeepSeek V3.2 0,27 /1,10 pro 1 Mio. Keine Bestes Preis-Leistungs-Verhältnis
xAI Grok-4 Schnell 0,20 /0,50 pro 1 Mio.🆕 Keine Schnellster + Werkzeugaufruf, ultraniedrig
xAI Grok-4 (Standard) 0,20 /1,50 pro 1 Mio. 🆕 Keine Argumentations-Flaggschiff von xAI
Mistral Kostenlose Testversion + kostenpflichtig Tarif begrenzt Europäische KI
OpenRouter Pay-per-Use Keine Über 100 Modelle aggr.
💰 GÜNSTIG GLM-5 (über Z.AI) 🆕 0,5 $/1 Mio. Täglich 10 Uhr 128K-Ausgabe, neuestes Flaggschiff
GLM-4.7 0,6 $/1 Mio. Täglich 10 Uhr Budgetsicherung
MiniMax M2.5 🆕 0,3 $/1 Mio. Eingabe 5-Stunden-Rollen Argumentation + Agentenaufgaben
MiniMax M2.1 0,2 $/1 Mio. 5-Stunden-Rollen Günstigste Option
Kimi K2.5 (Moonshot API) 🆕 Pay-per-Use Keine Direkter Zugriff auf die Moonshot-API
Kimi K2 $9/Monat pauschal 10 Millionen Token/Monat Vorhersehbare Kosten
🆓 KOSTENLOS Qoder $0 Unbegrenzt 5 Modelle unbegrenzt
Qwen $0 Unbegrenzt 4 Modelle unbegrenzt
Kiro $0 Unbegrenzt Claude Sonnet/Haiku (AWS Builder)
LongCat Flash-Lite 🆕 $0(50 Mio. Token/Tag 🔥) 1 RPS Größte kostenlose Quote der Welt
Bestäubungs-KI 🆕 $0(kein Schlüssel erforderlich) 1 Anforderung/15s GPT-5, Claude, DeepSeek, Lama 4
Cloudflare Workers AI 🆕 $0(10.000 Neuronen/Tag) ~150 resp/Tag Über 50 Modelle, globaler Vorsprung
Scaleway AI 🆕 0 $(insgesamt 1 Mio. Token) Tarif begrenzt EU/DSGVO, Qwen3 235B, Lama 70B > 🆕**Neue Modelle hinzugefügt (März 2026):**Grok-4 Fast-Familie für 0,20 $/0,50 $/M (Benchmark bei 1143 ms 30 % schneller als Gemini 2.5 Flash), GLM-5 über Z.AI mit 128K-Ausgabe, MiniMax M2.5-Argumentation, aktualisierte Preise für DeepSeek V3.2, Kimi K2.5 über die direkte Moonshot-API.

💡 0 $ Combo Stack Das komplette kostenlose Setup:```

🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever

Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED Qoder (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED LongCat Lite (lc/) → LongCat-Flash-Lite — 50M tokens/day 🔥 Pollinations (pol/) → GPT-5, Claude, DeepSeek, Llama 4 — no key needed Qwen (qw/) → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED Gemini (gemini/) → Gemini 2.5 Flash — 1,500 req/day free API key Cloudflare AI (cf/) → Llama 70B, Gemma 3, Mistral — 10K Neurons/day Scaleway (scw/) → Qwen3 235B, Llama 70B — 1M free tokens (EU) Groq (groq/) → Llama/Gemma ultra-fast — 14.4K req/day NVIDIA NIM (nvidia/) → 70+ open models — 40 RPM forever Cerebras (cerebras/) → Llama/Qwen world-fastest — 1M tok/day


**Kostenlos. Hört nie auf zu programmieren.**Konfigurieren Sie dies als eine OmniRoute-Kombination und alle Fallbacks erfolgen automatisch  kein manuelles Umschalten.---

---

## 🆓 Free Models — What You Actually Get

> Alle unten aufgeführten Modelle sind**100 % kostenlos, keine Kreditkarte erforderlich**. OmniRoute leitet automatisch zwischen ihnen weiter, wenn ein Kontingent aufgebraucht ist  kombinieren Sie sie alle für eine unzerstörbare 0-Dollar-Kombination.### 🔵 CLAUDE MODELS (via Kiro — AWS Builder ID)

| Modell | Präfix | Grenze | Ratenbegrenzung |
| ------------------- | ------ | ------------- | --------------------- |
| `claude-sonett-4.5` | `kr/` |**Unbegrenzt**| Keine gemeldete Tagesobergrenze |
| `claude-haiku-4.5` | `kr/` |**Unbegrenzt**| Keine gemeldete Tagesobergrenze |
| `claude-opus-4.6` | `kr/` |**Unbegrenzt**| Neuestes Werk von Kiro |### 🟢 QODER MODELS (Free PAT via qodercli)

| Modell | Präfix | Grenze | Ratenbegrenzung |
| ------------------- | ------ | ------------- | --------------- |
| `kimi-k2-thinking` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-plus` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `deepseek-r1` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `minimax-m2.1` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `kimi-k2` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |

> Empfohlene Verbindungsmethode:**Persönliches Zugriffstoken + „qodercli“**. Browser OAuth ist
> experimentell und standardmäßig deaktiviert, es sei denn, die Umgebungsvariablen „QODER_OAUTH_*“ sind konfiguriert.### 🟡 QWEN MODELS (Device Code Auth)

| Modell | Präfix | Grenze | Ratenlimit |
| ------------------- | ------ | ------------- | ------------------- |
| `qwen3-coder-plus` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-flash` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-next` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| „Vision-Modell“ | `qw/` |**Unbegrenzt**| Multimodal (Bilder) |### 🟣 GEMINI CLI (Google OAuth)

| Modell | Präfix | Grenze | Ratenlimit |
| ------------------------ | ------ | ------------ | ------------- |
| `gemini-3-flash-preview` | `gc/` |**180.000 Token/Monat**+ 1.000/Tag | Monatlicher Reset |
| `gemini-2.5-pro` | `gc/` | 180.000/Monat (gemeinsamer Pool) | Hohe Qualität |### ⚫ NVIDIA NIM (Free API Key — build.nvidia.com)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---------- | ------------ | ----------- | ----------------------------------------------------- |
| Kostenlos (Entwickler) | Keine Token-Obergrenze |**~40 U/min**| Über 70 Modelle; Übergang zu reinen Tarifbegrenzungen Mitte 2025 |

Beliebte kostenlose Modelle: „moonshotai/kimi-k2.5“ (Kimi K2.5), „z-ai/glm4.7“ (GLM 4.7), „deepseek-ai/deepseek-v3.2“ (DeepSeek V3.2), „nvidia/llama-3.3-70b-instruct“, „deepseek/deepseek-r1“.### ⚪ CEREBRAS (Free API Key — inference.cerebras.ai)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---- | ----------------- | ---------------- | ------------------------------------------- |
| Kostenlos |**1 Mio. Token/Tag**| 60.000 TPM / 30 U/min | Weltweit schnellste LLM-Inferenz; wird täglich zurückgesetzt |

Kostenlos erhältlich: „llama-3.3-70b“, „llama-3.1-8b“, „deepseek-r1-distill-llama-70b“.### 🔴 GROQ (Free API Key — console.groq.com)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---- | ------------- | ---------------- | ----------------------------------------- |
| Kostenlos |**14,4K RPD**| 30 U/min pro Modell | Keine Kreditkarte; 429 auf Limit, nicht berechnet |

Kostenlos erhältlich: „llama-3.3-70b-versatile“, „gemma2-9b-it“, „mixtral-8x7b“, „whisper-large-v3“.### 🔴 LONGCAT AI (Free API Key — longcat.chat) 🆕

| Modell | Präfix | Tägliches kostenloses Kontingent | Notizen |
| -------------- | ------ | ----------------- | --------- |
| `LongCat-Flash-Lite` | `lc/` |**50 Millionen Token**💥 | Größtes kostenloses Kontingent aller Zeiten |
| `LongCat-Flash-Chat` | `lc/` | 500.000 Token | Multi-Turn-Chat |
| „LongCat-Flash-Thinking“ | `lc/` | 500.000 Token | Begründung / CoT |
| `LongCat-Flash-Thinking-2601` | `lc/` | 500.000 Token | Version Januar 2026 |
| „LongCat-Flash-Omni-2603“ | `lc/` | 500.000 Token | Multimodal |

> 100 % kostenlos während der öffentlichen Beta. Melden Sie sich per E-Mail oder Telefon bei [longcat.chat](https://longcat.chat) an. Wird täglich um 00:00 UTC zurückgesetzt.### 🟢 POLLINATIONS AI (No API Key Required) 🆕

| Modell | Präfix | Ratenlimit | Anbieter dahinter |
| ---------- | ------ | ---------- | ------------------- |
| `openai` | `pol/` | 1 Anforderung/15s | GPT-5 |
| `Claude` | `pol/` | 1 Anforderung/15s | Anthropischer Claude |
| „Zwillinge“ | `pol/` | 1 Anforderung/15s | Google Gemini |
| `deepseek` | `pol/` | 1 Anforderung/15s | DeepSeek V3 |
| `Lama` | `pol/` | 1 Anforderung/15s | Meta Lama 4 Scout |
| „Mistral“ | `pol/` | 1 Anforderung/15s | Mistral KI |

> ✨**Keine Reibung:**Keine Anmeldung, kein API-Schlüssel. Fügen Sie den Bestäubungsanbieter mit einem leeren Schlüsselfeld hinzu und es funktioniert sofort.### 🟠 CLOUDFLARE WORKERS AI (Free API Key — cloudflare.com) 🆕

| Stufe | Tägliche Neuronen | Äquivalente Verwendung | Notizen |
| ---- | ------------- | --------------------------------------- | --------- |
| Kostenlos |**10.000**| ~150 LLM bzw. 500 Sek. Audio / 15.000 Einbettungen | Global Edge, 50+ Modelle |

Beliebte kostenlose Modelle: „@cf/meta/llama-3.3-70b-instruct“, „@cf/google/gemma-3-12b-it“, „@cf/openai/whisper-large-v3-turbo“ (kostenloses Audio!), „@cf/qwen/qwen2.5-coder-15b-instruct“.

> Erfordert API-Token + Konto-ID von [dash.cloudflare.com](https://dash.cloudflare.com). Konto-ID in den Anbietereinstellungen hinterlegen.### 🟣 SCALEWAY AI (1M Free Tokens — scaleway.com) 🆕

| Stufe | Kostenloses Kontingent | Standort | Notizen |
| ---- | ------------- | ------------ | ----------------------------------- |
| Kostenlos |**1 Mio. Token**| 🇫🇷 Paris, EU | Innerhalb der Grenzen ist keine Kreditkarte erforderlich |

Kostenlos verfügbar: „qwen3-235b-a22b-instruct-2507“ (Qwen3 235B!), „llama-3.1-70b-instruct“, „mistral-small-3.2-24b-instruct-2506“, „deepseek-v3-0324“.

> EU/DSGVO-konform. Holen Sie sich den API-Schlüssel unter [console.scaleway.com](https://console.scaleway.com).

>**💡 Der ultimative kostenlose Stack (11 Anbieter, 0 $ für immer):**
>
> ```
> Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED
> Qoder (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
> LongCat Lite (lc/) → LongCat-Flash-Lite  50 Millionen Token/Tag 🔥
> Bestäubungen (pol/) → GPT-5, Claude, DeepSeek, Llama 4  kein Schlüssel erforderlich
> Qwen (qw/) → qwen3-Coder-Modelle UNBEGRENZT
> Gemini (gemini/) → Gemini 2.5 Flash  1.500 Req/Tag kostenlos
> Cloudflare AI (cf/) → 50+ Modelle  10.000 Neuronen/Tag
> Scaleway (scw/) → Qwen3 235B, Llama 70B  1 Mio. kostenlose Token (EU)
> Groq (groq/) → Lama/Gemma  14,4K req/Tag ultraschnell
> NVIDIA NIM (nvidia/) → 70+ offene Modelle  40 U/min für immer
> Großhirn (Großhirn) → Lama/Qwen weltweit am schnellsten  1 Mio. tok/Tag
> ```## 🎙️ Free Transcription Combo

> Transkribieren Sie jedes Audio/Video für**0 $** Deepgram führt mit 200 $ kostenlos, AssemblyAI 50 $ Fallback, Groq Whisper als unbegrenztes Notfall-Backup.

| Anbieter | Kostenlose Credits | Bestes Modell | Ratenlimit |
| ----------------- | ---------------------- | -------------------------------------------- | ------------- |
| 🟢**Deepgram**|**200 $ gratis**(Anmeldung) | „nova-3“  beste Genauigkeit, über 30 Sprachen | Kein RPM-Limit für kostenlose Credits |
| 🔵**AssemblyAI**|**50 $ gratis**(Anmeldung) | „universal-3-pro“  Kapitel, Stimmung, PII | Kein RPM-Limit für kostenlose Credits |
| 🔴**Groq**|**Für immer kostenlos**| „whisper-large-v3“  OpenAI Whisper | 30 U/min (Geschwindigkeit begrenzt) |

**Vorgeschlagene Kombination in „/dashboard/combos“:**```
Name: free-transcription
Strategy: Priority
Nodes:
  [1] deepgram/nova-3          → uses $200 free first
  [2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
  [3] groq/whisper-large-v3    → free forever, emergency fallback

Dann unter „/dashboard/media“ → Registerkarte „Transkription“: Laden Sie eine beliebige Audio- oder Videodatei hoch → wählen Sie Ihren Kombinationsendpunkt aus → erhalten Sie Transkriptionen in unterstützten Formaten.## 💡 Key Features

OmniRoute v2.0 ist als Betriebsplattform konzipiert und nicht nur als Relay-Proxy.### 🆕 New — ClawRouter-Inspired Improvements (Mar 2026)

Funktion Was es tut
Grok-4 Fast Family xAI-Modelle für 0,20 $/0,50 $/M im Benchmarking 1143 ms (30 % schneller als Gemini 2.5 Flash)
🧠GLM-5 über Z.AI 128K-Ausgabekontext, 0,5 $/1 Mio. neuestes Flaggschiff der GLM-Familie
🔮MiniMax M2.5 Argumentation + Agentenaufgaben für 0,30 $/1 Mio. deutliche Verbesserung gegenüber M2.1
🎯toolCalling Flag pro Modell Pro Modell „toolCalling: true/false“ in der Registrierung AutoCombo überspringt nicht-toolfähige Modelle
🌍Mehrsprachige Absichtserkennung PT/ZH/ES/AR-Schlüsselwörter in der AutoCombo-Bewertung bessere Modellauswahl für nicht-englische Inhalte
📊Benchmark-gesteuerte Fallbacks Echte p95-Latenz aus der Kombinationsbewertung von Live-Anfrage-Feeds AutoCombo lernt aus tatsächlichen Daten
🔁Deduplizierung anfordern Content-Hash-basiertes Dedup-Fenster Multi-Agent-sicher, verhindert doppelte Gebühren
🔌Pluggable RouterStrategy Erweiterbare „RouterStrategy“-Schnittstelle benutzerdefinierte Routing-Logik als Plugins hinzufügen ### 🚀 Previous v2.0.9+ — Playground, CLI Fingerprints & ACP
Funktion Was es tut
🎮Modellspielplatz Dashboard-Seite zum direkten Testen jedes Modells Anbieter-/Modell-/Endpunkt-Selektoren, Monaco-Editor, Streaming, Abbruch, Timing
🔏CLI-Fingerabdruckabgleich Header-/Body-Reihenfolge pro Anbieter, um mit nativen CLI-Signaturen übereinzustimmen schalten Sie pro Anbieter unter „Einstellungen“ > „Sicherheit“ um.Ihre Proxy-IP bleibt erhalten
🤝ACP-Unterstützung (Agent Client Protocol) CLI-Agent-Erkennung (Codex, Claude, Goose, Gemini CLI, OpenClaw + 9 weitere), Prozess-Spawner, „/api/acp/agents“-Endpunkt
🤖ACP-Agenten-Dashboard Debuggen Seite „Agenten“ Raster mit 14 Agenten mit Installationsstatus, Version und benutzerdefiniertem Agentenformular für jedes CLI-Tool.OpenCode-Benutzer erhalten eine Schaltfläche „Opencode.json herunterladen“, die automatisch eine gebrauchsfertige Konfiguration mit allen verfügbaren Modellen generiert.
🔧Benutzerdefiniertes Modell „apiFormat“-Routing Benutzerdefinierte Modelle mit „apiFormat: „responses““ werden jetzt korrekt an den Responses-API-Übersetzer weitergeleitet
🏢Codex Workspace Isolation Mehrere Codex-Arbeitsbereiche pro E-Mail OAuth trennt Verbindungen korrekt nach Arbeitsbereichs-ID
🔄Electron Auto-Update Desktop-App sucht nach Updates + automatische Installation beim Neustart ### 🤖 Agent & Protocol Operations (v2.0)
Funktion Was es tut
🔧MCP-Server (25 Tools) IDE/Agent-Tools über 3 Transporte: stdio, SSE (/api/mcp/sse), Streamable HTTP (/api/mcp/stream). 18 Kerne + 3 Speicher + 4 Fertigkeitswerkzeuge
🤝A2A-Server (JSON-RPC + SSE) Ausführung von Agent-zu-Agent-Aufgaben mit Synchronisierungs- und Streaming-Flows
🧭Consolidated Endpoints-Seite Verwaltungsseite mit Registerkarten mit den Registerkarten „Endpunkt-Proxy“, „MCP“, „A2A“ und „API-Endpunkte“
🎚️Service-Aktivierung/Deaktivierung EIN/AUS-Schalter für MCP und A2A mit Einstellungspersistenz (Standard: AUS)
🛰️MCP Runtime Heartbeat Echter Prozessstatus (PID, Betriebszeit, Heartbeat-Alter, Transport, Scope-Modus)
📋MCP Audit Trail Filterbare Audit-Protokolle mit Erfolg/Misserfolg und Schlüsselzuordnung
🔐Durchsetzung des MCP-Geltungsbereichs 10 granulare Umfangsberechtigungen für kontrollierten Werkzeugzugriff
📡A2A Task Lifecycle Management Aufgaben auflisten/filtern, Ereignisse/Artefakte prüfen, laufende Aufgaben abbrechen
📋Agentenkartenerkennung /.well-known/agent.json für die automatische Client-Erkennung
🧪Protokoll-E2E-Testkabel Echtes MCP SDK + A2A-Client fließt in „test:protocols:e2e“
⚙️Betriebskontrollen Schaltkombination, Anwenden von Resilienzprofilen, Zurücksetzen von Leistungsschaltern über eine Bedienoberfläche ### 🧠 Routing & Intelligence
Funktion Was es tut
🎯Intelligenter 4-Stufen-Fallback Automatische Route: Abonnement → API-Schlüssel → Günstig → Kostenlos
📊Kontingentverfolgung in Echtzeit Live-Token-Zählung + Reset-Countdown pro Anbieter
🔄Formatübersetzung OpenAI ↔ Claude ↔ Gemini ↔ Antworten mit schemasicheren Konvertierungen
👥Unterstützung mehrerer Konten Mehrere Konten pro Anbieter mit intelligenter Auswahl
🔄Automatische Token-Aktualisierung OAuth-Token werden bei Wiederholung automatisch aktualisiert
🎨Benutzerdefinierte Kombinationen 9 Ausgleichsstrategien + Fallback-Kettenkontrolle
🌐Wildcard-Router provider/* dynamisches Routing
🧠Budgetkontrollen denken Passthrough-, automatische, benutzerdefinierte und adaptive Reasoning-Grenzwerte
🔀Modell-Aliase Integrierte + benutzerdefinierte Modell-Aliasing- und Migrationssicherheit
Hintergrundverschlechterung Hintergrundaufgaben mit niedriger Priorität an günstigere Modelle weiterleiten
🧪Aufgabenbewusstes Smart Routing Modell automatisch nach Inhaltstyp auswählen (Codierung/Vision/Analyse/Zusammenfassung)
🔄A2A-Agent-Workflows Deterministischer FSM-Orchestrator für zustandsbehaftete mehrstufige Agentenausführungen
🔀Adaptives Routing Dynamische Strategieüberschreibung basierend auf Token-Volumen und Prompt-Komplexität
🎲Anbietervielfalt Shannon-Entropiebewertung, die die Verteilung des Auto-Combo-Verkehrs ausgleicht
💬System-Prompt-Injektion Globale Verhaltenskontrollen werden konsequent angewendet
📄Antwort-API-Kompatibilität Vollständige „/v1/responses“-Unterstützung für Codex und erweiterte Agenten-Workflows ### 🎵 Multi-Modal APIs
Funktion Was es tut
🖼️Bilderzeugung /v1/images/generations mit Cloud- und lokalen Backends
📐Einbettungen /v1/embeddings für Such- und RAG-Pipelines
🎤Audio-Transkription „/v1/audio/transcriptions“ 7 Anbieter (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), automatische Spracherkennung, MP4/MP3/WAV-Unterstützung
🔊Text-to-Speech „/v1/audio/speech“ 10 Anbieter (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) mit korrekten Fehlermeldungen
🎬Videogenerierung /v1/videos/generations (ComfyUI + SD WebUI-Workflows)
🎵Musikgeneration /v1/music/generations (ComfyUI-Workflows)
🛡️Moderationen /v1/moderations Sicherheitsüberprüfungen
🔀Neueinstufung /v1/rerank für Relevanzbewertung
🔍Websuche🆕 „/v1/search“ 5 Anbieter (Serper, Brave, Perplexity, Exa, Tavily), 6.500+ kostenlos/Monat, automatisches Failover, Cache ### 🛡️ Resilience, Security & Governance
Funktion Was es tut
🔌Leistungsschalter Auslösung/Wiederherstellung pro Modell mit Schwellenwertkontrollen
🎯Endpunktfähige Modelle Benutzerdefinierte Modelle deklarieren unterstützte Endpunkte + API-Format
🛡️Anti-Donnerende Herde Mutex- und Semaphorschutz bei Wiederholungs-/Ratenereignissen
🧠Semantik + Signatur-Cache Kosten-/Latenzreduzierung mit zwei Cache-Schichten
Idempotenz anfordern Doppeltes Schutzfenster
🔒TLS-Fingerabdruck-Spoofing Browserähnlicher TLS-Fingerabdruck reduziert die Bot-Erkennung und Kontokennzeichnung
🔏CLI-Fingerabdruckabgleich Entspricht nativen CLI-Anfragesignaturen reduziert das Verbotsrisiko und behält gleichzeitig die Proxy-IP bei
🌐IP-Filterung Zulassungs-/Blocklistenkontrolle für exponierte Bereitstellungen
📊Bearbeitbare Ratenlimits Konfigurierbare globale/Provider-Level-Limits mit Persistenz
📉Anmutige Degradierung Mehrschichtige Fallbacks zum Schutz des Kern-Gateway-Betriebs
📜Audit-Trail konfigurieren Diff-basierte Änderungsverfolgung verhindert betriebliche Abweichungen durch einfache Rollbacks
Provider Health Sync Proaktive Überwachung des Token-Ablaufs, die Warnungen vor Autorisierungsfehlern auslöst
🚪Gesperrte Konten automatisch deaktivieren Funktionsfähiger Leistungsschalter, der dauerhaft gesperrte Token-Konten automatisch verschließt
🔑API-Schlüsselverwaltung + Scoping Sichere Schlüsselausgabe/-rotation und Modell-/Anbieterkontrollen
👁️Scoped API Key Reveal🆕 Opt-in-Wiederherstellung von API-Schlüsseln über „ALLOW_API_KEY_REVEAL“
🛡️Geschützte „/Modelle“ Optionales Authentifizierungs-Gating und Provider-Ausblenden für Modellkatalog ### 📊 Observability & Analytics
Funktion Was es tut
📝Anfrage + Proxy-Protokollierung Vollständige Anfrage/Antwort- und Proxy-Protokollierung
📉Gestreamte detaillierte Protokolle🆕 Rekonstruiert SSE-Nutzlastströme sauber in der Benutzeroberfläche
📋Einheitliches Protokoll-Dashboard Anforderungs-, Proxy-, Audit- und Konsolenansichten auf einer Seite
🔍Telemetrie anfordern p50/p95/p99-Latenz und Anforderungsverfolgung
🏥Gesundheits-Dashboard Betriebszeit, Breaker-Zustände, Sperrungen, Cache-Statistiken
💰Kostenverfolgung Budgetkontrolle und Preistransparenz pro Modell
📈Analysevisualisierungen Einblicke in die Modell-/Anbieternutzung und Trendansichten
🧪Bewertungsrahmen Golden-Set-Test mit konfigurierbaren Match-Strategien
📡Live-Diagnose🆕 Semantische Cache-Umgehung für genaue Combo-Live-Tests ### ☁️ Deployment & Platform
Funktion Was es tut
🌐Überall bereitstellen Localhost, VPS, Docker, Cloud-Umgebungen
🚇Cloudflare-Tunnel🆕 Quick-Tunnel-Integration mit einem Klick über das Dashboard
🔑API-Schlüsselmodellfilterung Native /v1/models-Antwort gefiltert über zugewiesene Bearer-Kontextrollen
Smart Cache Bypass Konfigurierbare TTL-Heuristik und erzwungene Refetch-Kontrollen
🔄Sichern/Wiederherstellen Export-/Import- und Disaster-Recovery-Abläufe
🧙Onboarding-Assistent Erstmaliges geführtes Setup
🔧CLI-Tools-Dashboard Ein-Klick-Setup für beliebte Codierungstools
🎮Modellspielplatz Testen Sie alle Anbieter/Modelle/Endpunkte über das Dashboard
🔏CLI-Fingerabdruck-Umschaltung Fingerabdruckabgleich pro Anbieter unter Einstellungen > Sicherheit
🌐i18n (30 Sprachen) Vollständige Sprachunterstützung für Dashboard und Dokumente mit RTL-Abdeckung
🧹Alle Modelle löschen Löschen der Modellliste in den Anbieterdetails mit einem Klick
👁️Sidebar-Steuerelemente🆕 Komponenten und Integrationen in den Darstellungseinstellungen ausblenden
📋Problemvorlagen Standardisierte GitHub-Vorlagen für Fehler und Funktionen
📂Benutzerdefiniertes Datenverzeichnis „DATA_DIR“-Überschreibung für Speicherort ### Feature Deep Dive

Smart fallback with practical cost control

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6
  2. nvidia/llama-3.3-70b
  3. glm/glm-4.7
  4. if/kimi-k2-thinking

Wenn Kontingent, Rate oder Integrität fehlschlagen, wechselt OmniRoute automatisch zum nächsten Kandidaten, ohne dass ein manueller Wechsel erforderlich ist.#### Protocol management that is visible and operable

  • MCP + A2A sind in der Benutzeroberfläche und in den Dokumenten erkennbar (nicht ausgeblendet)
  • Protokollstatus-APIs stellen Live-Betriebsdaten bereit (/api/mcp/*, /api/a2a/*)
  • Dashboards umfassen Aktionen für Tag-2-Operationen (Kombinationsumschaltung, Zurücksetzen von Leistungsschaltern, Aufgabenabbruch).#### Translator + validation workflow

Der Übersetzerbereich umfasst:

-Spielplatz: Transformationsprüfungen anfordern -Chat-Tester: vollständiger Anfrage-/Antwort-Roundtrip -Prüfstand: mehrere Fälle in einem Durchgang -Live Monitor: Echtzeit-Verkehrsansicht

Plus Protokollvalidierung mit echten Clients über „npm run test:protocols:e2e“.

📖MCP Server README Tool-Referenz, IDE-Konfigurationen und Client-Beispiele

📖A2A Server README Fähigkeiten, JSON-RPC-Methoden, Streaming und Aufgabenlebenszyklus## 🧪 Evaluations (Evals)

OmniRoute umfasst ein integriertes Bewertungsframework zum Testen der LLM-Antwortqualität anhand eines Golden Sets. Greifen Sie darauf überAnalytics → Evalsim Dashboard zu.### Built-in Golden Set

Das vorinstallierte „OmniRoute Golden Set“ enthält Testfälle für:

  • Grüße, Mathematik, Geographie, Codegenerierung
  • Einhaltung des JSON-Formats, Übersetzung, Markdown-Generierung
  • Sicherheitsverweigerung (schädlicher Inhalt), Zählung, boolesche Logik### Evaluation Strategies
Strategie Beschreibung Beispiel
„genau“ Die Ausgabe muss genau mit übereinstimmen „4“
„enthält“ Die Ausgabe muss eine Teilzeichenfolge enthalten (Groß-/Kleinschreibung wird nicht beachtet) „Paris“
regex Die Ausgabe muss mit dem Regex-Muster übereinstimmen "1.*2.*3"
„Benutzerdefiniert“ Benutzerdefinierte JS-Funktion gibt true/false zurück (Ausgabe) => Ausgabelänge > 10 ---

📖 Setup Guide

Protocol Setup (MCP + A2A)

🧩 MCP-Setup (Model Context Protocol)

Starten Sie den MCP-Transport im Standardmodus:```bash omniroute --mcp


Empfohlener Validierungsablauf:

1. Verbinden Sie Ihren MCP-Client über stdio.
2. Führen Sie „omniroute_get_health“ aus.
3. Führen Sie „omniroute_list_combos“ aus.
4. Öffnen Sie „/dashboard/mcp“, um Heartbeat, Aktivität und Audit zu bestätigen.

Nützliche APIs für die Automatisierung:

- `GET /api/mcp/status`
- `GET /api/mcp/tools`
- `GET /api/mcp/audit`
- `GET /api/mcp/audit/stats`</details>

<Details>
<summary><b>🤝 A2A-Setup (Agent2Agent)</b></summary>

Entdecken Sie den Agenten:```bash
curl http://localhost:20128/.well-known/agent.json

Senden Sie eine Aufgabe:```bash curl -X POST http://localhost:20128/a2a
-H 'content-type: application/json'
-d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'


Lebenszyklus verwalten:

- `GET /api/a2a/status`
- `GET /api/a2a/tasks`
- `GET /api/a2a/tasks/:id`
- `POST /api/a2a/tasks/:id/cancel`

Operative Benutzeroberfläche:

- „/dashboard/a2a“ für Aufgaben-/Status-/Stream-Beobachtbarkeit und Smoke-Aktionen</details>

<Details>
<summary><b>🧪 End-to-End-Protokollvalidierung</b></summary>

Validieren Sie beide Protokolle mit echten Clients:```bash
npm run test:protocols:e2e

Dies bestätigt:

  • MCP SDK-Client-Verbindung/Liste/Anruf
  • A2A-Erkennung/Senden/Streamen/Get/Abbrechen
  • Vergleichen Sie die Daten in MCP-Audit- und A2A-Aufgabenverwaltungs-APIs
💳 Abonnementanbieter### Claude Code (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

**Profi-Tipp:**Verwenden Sie Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute verfolgt das Kontingent pro Modell!### OpenAI Codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Codex Account Limit Management (5h + Weekly)

Für jedes Codex-Konto gibt es jetzt Richtlinienumschaltungen unter „Dashboard -> Anbieter“:

  • „5h“ (EIN/AUS): Erzwingt die 5-Stunden-Fensterschwellenrichtlinie.
  • „Wöchentlich“ (EIN/AUS): Erzwingen Sie die wöchentliche Fensterschwellenrichtlinie. Schwellenwertverhalten: Wenn ein aktiviertes Fenster eine Nutzung von >=90 % erreicht, wird dieses Konto übersprungen.
  • Rotationsverhalten: OmniRoute leitet automatisch zum nächsten berechtigten Codex-Konto weiter.
  • Zurücksetzungsverhalten: Wenn die „resetAt“-Zeit des Anbieters verstrichen ist, wird das Konto automatisch wieder berechtigt.

Szenarien:

  • „5 Stunden EIN“ + „Wöchentlich EIN“: Das Konto wird übersprungen, wenn eines der Fenster den Schwellenwert erreicht.
  • „5h AUS“ + „Wöchentlich EIN“: Nur wöchentliche Nutzung kann das Konto sperren.
  • „5h EIN“ + „Wöchentlich AUS“: Nur eine 5-stündige Nutzung kann das Konto sperren.
  • „resetAt“ übergeben: Das Konto wechselt automatisch wieder in die Rotation (keine manuelle erneute Aktivierung).### Gemini CLI (FREE 180K/month!)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

**Bester Wert:**Riesiges kostenloses Kontingent! Verwenden Sie dies vor kostenpflichtigen Stufen.### GitHub Copilot

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3.1-pro-preview
🔑 API-Schlüsselanbieter### NVIDIA NIM (FREE developer access — 70+ models)
  1. Registrieren Sie sich: build.nvidia.com
  2. Holen Sie sich einen kostenlosen API-Schlüssel (1000 Inferenz-Credits inbegriffen)
  3. Dashboard → Anbieter hinzufügen → NVIDIA NIM:
    • API-Schlüssel: „nvapi-your-key“.

Modelle:„nvidia/llama-3.3-70b-instruct“, „nvidia/mistral-7b-instruct“ und mehr als 50 weitere

**Profi-Tipp:**OpenAI-kompatible API funktioniert nahtlos mit der Formatübersetzung von OmniRoute!### DeepSeek

  1. Registrieren Sie sich: platform.deepseek.com
  2. Holen Sie sich den API-Schlüssel
  3. Dashboard → Anbieter hinzufügen → DeepSeek

Modelle:deepseek/deepseek-chat, deepseek/deepseek-coder### Groq (Free Tier Available!)

  1. Registrieren Sie sich: console.groq.com
  2. Holen Sie sich den API-Schlüssel (kostenloses Kontingent inbegriffen)
  3. Dashboard → Anbieter hinzufügen → Groq

Modelle:„groq/llama-3.3-70b“, „groq/mixtral-8x7b“.

**Profi-Tipp:**Ultraschnelle Inferenz am besten für Echtzeit-Codierung!### OpenRouter (100+ Models)

  1. Registrieren Sie sich: openrouter.ai
  2. Holen Sie sich den API-Schlüssel
  3. Dashboard → Anbieter hinzufügen → OpenRouter

**Modelle:**Greifen Sie über einen einzigen API-Schlüssel auf über 100 Modelle aller großen Anbieter zu.

Dashboard-Verhalten:OpenRouter-Modelle werden überVerfügbare Modelleverwaltet. Durch manuelles Hinzufügen, Importieren und automatische Synchronisieren wird dieselbe Liste aktualisiert.

💰 Günstige Anbieter (Backup)### GLM-4.7 (Daily reset, $0.6/1M)
  1. Registrieren Sie sich: Zhipu AI
  2. Holen Sie sich den API-Schlüssel vom Coding Plan
  3. Dashboard → API-Schlüssel hinzufügen:
    • Anbieter: glm
    • API-Schlüssel: „Ihr-Schlüssel“.

Verwenden Sie:glm/glm-4.7

**Profi-Tipp:**Coding Plan bietet 3× Kontingent zu 1/7 Kosten! Täglich um 10:00 Uhr zurückgesetzt.### MiniMax M2.1 (5h reset, $0.20/1M)

  1. Registrieren Sie sich: MiniMax
  2. Holen Sie sich den API-Schlüssel
  3. Dashboard → API-Schlüssel hinzufügen

Verwenden Sie:„minimax/MiniMax-M2.1“.

**Profi-Tipp:**Günstigste Option für langen Kontext (1 Mio. Token)!### Kimi K2 ($9/month flat)

  1. Abonnieren: Moonshot AI
  2. Holen Sie sich den API-Schlüssel
  3. Dashboard → API-Schlüssel hinzufügen

Verwendung:kimi/kimi-latest

**Profi-Tipp:**Festpreis: 9 $/Monat für 10 Mio. Token = 0,90 $/1 Mio. effektive Kosten!

🆓 KOSTENLOSE Anbieter (Notfall-Backup)### Qoder (5 FREE models via OAuth)
Dashboard → Connect Qoder
→ Qoder OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (4 FREE models via Device Code)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude FREE)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5
🎨 Combos erstellen### Example 1: Maximize Subscription → Cheap Backup
Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Example 2: Free-Only (Zero Cost)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!
🔧 CLI-Integration### Cursor IDE
Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Verwenden Sie die SeiteCLI-Toolsim Dashboard für die Ein-Klick-Konfiguration oder bearbeiten Sie „~/.claude/settings.json“ manuell.### Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

OpenClaw

Option 1 Dashboard (empfohlen):``` Dashboard → CLI Tools → OpenClaw → Select Model → Apply


**Option 2  Manuell:**Bearbeiten Sie „~/.openclaw/openclaw.json“:```json
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

**Hinweis:**OpenClaw funktioniert nur mit lokaler OmniRoute. Verwenden Sie „127.0.0.1“ anstelle von „localhost“, um Probleme mit der IPv6-Auflösung zu vermeiden.### Cline / Continue / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

OpenCode

**Schritt 1:**OmniRoute als benutzerdefinierten Anbieter hinzufügen:```bash opencode /connect

Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key


**Schritt 2:**Erstellen/bearbeiten Sie „opencode.json“ in Ihrem Projektstammverzeichnis:```json
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "omniroute": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OmniRoute",
      "options": {
        "baseURL": "http://localhost:20128/v1"
      },
      "models": {
        "cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
        "gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
        "if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
      }
    }
  }
}

**Schritt 3:**Wählen Sie das Modell in OpenCode aus:```bash /models

Select any OmniRoute model from the list


>**Tipp:**Fügen Sie alle in Ihrem OmniRoute-Endpunkt „/v1/models“ verfügbaren Modelle zum Abschnitt „Modelle“ hinzu. Verwenden Sie das Format „Anbieter/Modell-ID“ aus Ihrem OmniRoute-Dashboard.</details>

---

## Fehlerbehebung

<Details>
<summary><b>Klicken Sie hier, um die Anleitung zur Fehlerbehebung zu erweitern</b></summary>

**„Sprachmodell hat keine Nachrichten bereitgestellt“**

- Anbieterkontingent erschöpft → Überprüfen Sie den Dashboard-Kontingent-Tracker
- Lösung: Combo-Fallback verwenden oder auf günstigere Stufe wechseln

**Ratenbegrenzung**

- Abonnementkontingent aufgebraucht → Fallback auf GLM/MiniMax
- Kombination hinzufügen: „cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking“.

**OAuth-Token abgelaufen**

- Automatische Aktualisierung durch OmniRoute
- Wenn die Probleme weiterhin bestehen: Dashboard → Anbieter → Verbindung wiederherstellen

**Hohe Kosten**

- Überprüfen Sie die Nutzungsstatistiken im Dashboard → Kosten
- Primärmodell auf GLM/MiniMax umstellen
- Nutzen Sie den kostenlosen Tarif (Gemini CLI, Qoder) für unkritische Aufgaben

**Dashboard-/API-Ports sind falsch**

- „PORT“ ist der kanonische Basisport (und standardmäßig API-Port)
 „API_PORT“ überschreibt nur den OpenAI-kompatiblen API-Listener
 „DASHBOARD_PORT“ überschreibt nur den Dashboard/Next.js-Listener
- Setzen Sie „NEXT_PUBLIC_BASE_URL“ auf Ihr Dashboard/öffentliche URL (für OAuth-Rückrufe)

**Cloud-Synchronisierungsfehler**

- Überprüfen Sie, ob „BASE_URL“ auf Ihre laufende Instanz verweist
 Überprüfen Sie, ob „CLOUD_URL“ auf Ihren erwarteten Cloud-Endpunkt verweist
- Halten Sie die Werte von „NEXT_PUBLIC_*“ an den serverseitigen Werten ausgerichtet

**Erste Anmeldung funktioniert nicht**

- Überprüfen Sie „INITIAL_PASSWORD“ in „.env“.
- Wenn nicht festgelegt, lautet das Fallback-Passwort „123456“.

**Keine Anfrageprotokolle**

 Anforderungsartefakte werden als eine JSON-Datei pro Anforderung in „DATA_DIR/call_logs/“ geschrieben
- Aktivieren Sie die Pipeline-Erfassung über Dashboard → Protokolle → Protokolle anfordern, wenn Sie detaillierte Payloads pro Phase benötigen
- Legen Sie „APP_LOG_TO_FILE=true“ fest, wenn Sie auch Anwendungskonsolenprotokolle in „logs/application/app.log“ haben möchten
- Passen Sie „APP_LOG_MAX_FILE_SIZE“, „APP_LOG_RETENTION_DAYS“, „APP_LOG_MAX_FILES“ und „CALL_LOG_MAX_ENTRIES“ nach Bedarf an

**Verbindungstest zeigt „Ungültig“ für OpenAI-kompatible Anbieter**

 Viele Anbieter stellen keinen „/models“-Endpunkt bereit
 OmniRoute v1.0.6+ beinhaltet eine Fallback-Validierung über Chat-Abschlüsse
 Stellen Sie sicher, dass die Basis-URL das Suffix „/v1“ enthält### 🔐 OAuth on a Remote Server

<a name="oauth-on-a-remote-server"></a>
<a name="oauth-em-server-remoto"></a>

>**⚠️ Wichtig für Benutzer, die OmniRoute auf einem VPS, Docker oder einem anderen Remote-Server ausführen**#### Why does Antigravity / Gemini CLI OAuth fail on remote servers?

Die Anbieter**Antigravity**und**Gemini CLI**verwenden**Google OAuth 2.0**. Google verlangt, dass „redirect_uri“ im OAuth-Flow genau mit einem der vorregistrierten URIs in der Google Cloud Console der App übereinstimmt.

Die in OmniRoute gebündelten OAuth-Anmeldeinformationen werden**nur für „localhost“**registriert. Wenn Sie auf OmniRoute auf einem Remote-Server zugreifen (z. B. „https://omniroute.myserver.com“), lehnt Google die Authentifizierung mit Folgendem ab:```
Error 400: redirect_uri_mismatch

Solution: Configure your own OAuth credentials

Sie müssen in der Google Cloud Console eineOAuth 2.0-Client-IDmit dem URI Ihres Servers erstellen.#### Step-by-step

1. Öffnen Sie die Google Cloud Console

Gehen Sie zu: https://console.cloud.google.com/apis/credentials

2. Erstellen Sie eine neue OAuth 2.0-Client-ID

  • Klicken Sie auf**„+ Anmeldeinformationen erstellen“„OAuth-Client-ID“**
  • Anwendungstyp:„Webanwendung“
  • Name: beliebig (z. B. „OmniRoute Remote“)

3. Autorisierte Weiterleitungs-URIs hinzufügen

Fügen Sie im Feld**"Autorisierte Weiterleitungs-URIs"**Folgendes hinzu:``` https://your-server.com/callback


> Ersetzen Sie „Ihr-Server.com“ durch die Domäne oder IP Ihres Servers (geben Sie bei Bedarf den Port ein, z. B. „http://45.33.32.156:20128/callback“).

**4. Speichern und kopieren Sie die Anmeldeinformationen**

Nach der Erstellung zeigt Google die**Client-ID**und das**Client-Geheimnis**an.

**5. Umgebungsvariablen festlegen**

In Ihrer „.env“ (oder Docker-Umgebungsvariablen):```bash
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

# For Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

6. OmniRoute neu starten```bash

npm:

npm run dev

Docker:

docker restart omniroute


**7. Versuchen Sie erneut, eine Verbindung herzustellen**

Dashboard → Anbieter → Antigravity (oder Gemini CLI) → OAuth

Google leitet jetzt korrekt zu „https://your-server.com/callback“ weiter.---

#### Temporary workaround (without custom credentials)

Wenn Sie jetzt keine eigenen Anmeldeinformationen einrichten möchten, können Sie dennoch den**manuellen URL-Ablauf**verwenden:

1. OmniRoute öffnet die Google-Autorisierungs-URL
2. Nach der Autorisierung versucht Google, auf „localhost“ umzuleiten (was auf dem Remote-Server fehlschlägt).
3.**Kopieren Sie die vollständige URL**aus der Adressleiste Ihres Browsers (auch wenn die Seite nicht geladen wird)
4. Fügen Sie diese URL in das Feld ein, das im OmniRoute-Verbindungsmodal angezeigt wird
5. Klicken Sie auf**„Verbinden“**

> Dies funktioniert, weil der Autorisierungscode in der URL unabhängig davon gültig ist, ob die Weiterleitungsseite geladen wurde.---

<Details>
<summary><b>🇧🇷 Versão em Português</b></summary>#### Por que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Wir haben**Antigravity**und**Gemini CLI**mit**Google OAuth 2.0**zur Authentifizierung getestet. Google erwartet, dass „redirect_uri“ kein OAuth-Fluss verwendet, da**exatamente**ein URI vorab in die Google Cloud Console aufgenommen wurde.

Als OAuth-Anmelder wurde OmniRoute nicht als „localhost“**registriert. Wenn Sie auf einen Remote-Server (z. B. „https://omniroute.meuservidor.com“) auf OmniRoute zugreifen, lehnt Google die Authentifizierung ab:```
Error 400: redirect_uri_mismatch

Solução: Configure suas próprias credenciais OAuth

Sie schreiben bitte eineOAuth 2.0-Client-IDin der Google Cloud Console mit einem URI für Ihren Server.#### Passo a passo

1. Zugriff auf die Google Cloud Console

Abra: https://console.cloud.google.com/apis/credentials

2. Rufen Sie eine neue OAuth 2.0-Client-ID auf

  • Klicken Sie auf**"+ Anmeldeinformationen erstellen""OAuth-Client-ID"**
  • Anwendungstyp:„Webanwendung“
  • Name: Wählen Sie einen beliebigen Namen (z. B. „OmniRoute Remote“)

3. Adicione als autorisierte Weiterleitungs-URIs

Nein,"Autorisierte Weiterleitungs-URIs", Zusatz:``` https://seu-servidor.com/callback


> Ersetzen Sie Ihren Server durch „seu-servidor.com“ oder die IP Ihres Servers (einschließlich der erforderlichen Portierung, z. B. „http://45.33.32.156:20128/callback“).

**4. Als Anmeldedaten speichern und kopieren**

Anschließend hat Google die**Client-ID**und das**Client-Geheimnis**angezeigt.

**5. Als Umgebungsvariationen konfigurieren**

Kein `.env` (oder mehrere Docker-Umgebungsvarianten):```bash
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

6. Neuzugang zu OmniRoute```bash

Se usando npm:

npm run dev

Se usando Docker:

docker restart omniroute


**7. Tente conectar novamente**

Dashboard → Anbieter → Antigravity (oder Gemini CLI) → OAuth

Dann leiten Sie Google direkt an „https://seu-servidor.com/callback“ weiter und überprüfen Sie die Funktion.---

#### Workaround temporário (sem configurar credenciais próprias)

Wenn Sie vorab keine Berechtigung erhalten möchten, besteht die Möglichkeit, das**URL-Handbuch**zu verwenden:

1. OmniRoute ruft eine von Google autorisierte URL auf
2. Nachdem Sie den Autor autorisiert haben, sendet Google eine Weiterleitung an „localhost“ (das bedeutet, dass Sie den Server nicht weiterleiten können).
3.**Kopieren Sie eine vollständige URL**, um sie in Ihren Browser zu laden (bitte beachten Sie, dass die Seite noch nicht abgeschlossen ist).
4. Geben Sie die URL ein, die nicht zur Verbindung mit OmniRoute verwendet werden soll
5. Klicken Sie auf**„Connect“**

> Diese Problemumgehung funktioniert aufgrund des Autorisierungscodes auf der URL und ist unabhängig von der Weiterleitung oder Nicht-Weiterleitung gültig.</details>

---

</details>

## 🛠️ Tech Stack

<Details>
<summary><b>Klicken Sie hier, um die Tech-Stack-Details zu erweitern</b></summary>

-**Laufzeit**: Node.js 1822 LTS (⚠️ Node.js 24+ wird**nicht unterstützt** native Binärdateien von „better-sqlite3“ sind inkompatibel)
-**Sprache**: TypeScript 5.9 **100 % TypeScript**über „src/“ und „open-sse/“ (kein „any“ in Kernmodulen seit Version 2.0)
-**Framework**: Next.js 16 + React 19 + Tailwind CSS 4
-**Datenbank**: LowDB (JSON) + SQLite (Domänenstatus + Proxy-Protokolle + MCP-Prüfung + Routing-Entscheidungen)
-**Schemas**: Zod (MCP-Tool-I/O-Validierung, API-Verträge)
-**Protokolle**: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
-**Streaming**: Vom Server gesendete Ereignisse (SSE)
-**Auth**: OAuth 2.0 (PKCE) + JWT + API-Schlüssel + MCP-bezogene Autorisierung
-**Testen**: Node.js-Testläufer + Vitest (über 900 Tests einschließlich Einheit, Integration, E2E)
-**CI/CD**: GitHub-Aktionen (automatische NPM-Veröffentlichung + Docker Hub bei Veröffentlichung)
-**Website**: [omniroute.online](https://omniroute.online)
-**Paket**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute)
-**Docker**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute)
-**Resilienz**: Leistungsschalter, exponentielles Backoff, Anti-Donner-Herde, TLS-Spoofing, automatische Kombinations-Selbstheilung</details>

---

## Dokumentation

| Dokument | Beschreibung |
| ---------------------------------------------- | --------------------------------------------------- |
| [Benutzerhandbuch](docs/USER_GUIDE.md) | Anbieter, Kombinationen, CLI-Integration, Bereitstellung |
| [API-Referenz](docs/API_REFERENCE.md) | Alle Endpunkte mit Beispielen |
| [MCP-Server](open-sse/mcp-server/README.md) | 16 MCP-Tools, IDE-Konfigurationen, Python/TS/Go-Clients |
| [A2A-Server](src/lib/a2a/README.md) | JSON-RPC 2.0-Protokoll, Fähigkeiten, Streaming, Aufgabenverwaltung |
| [Auto-Combo-Engine](docs/auto-combo.md) | 6-Faktor-Bewertung, Moduspakete, Selbstheilung |
| [Fehlerbehebung](docs/TROUBLESHOOTING.md) | Häufige Probleme und Lösungen |
| [Architektur](docs/ARCHITECTURE.md) | Systemarchitektur und Interna |
| [Mitwirken](CONTRIBUTING.md) | Entwicklungsaufbau und Richtlinien |
| [OpenAPI-Spezifikation](docs/openapi.yaml) | OpenAPI 3.0-Spezifikation |
| [Sicherheitsrichtlinie](SECURITY.md) | Schwachstellenmeldung und Sicherheitspraktiken |
| [VM-Bereitstellung](docs/VM_DEPLOYMENT_GUIDE.md) | Vollständige Anleitung: VM + Nginx + Cloudflare-Setup |
| [Features-Galerie](docs/FEATURES.md) | Visuelle Dashboard-Tour mit Screenshots |
| [Release-Checkliste](docs/RELEASE_CHECKLIST.md) | Validierungsschritte vor der Veröffentlichung |---

## 🗺️ Roadmap

Für OmniRoute sind**210+ Funktionen**in mehreren Entwicklungsphasen geplant. Hier sind die Schlüsselbereiche:

| Kategorie | Geplante Funktionen | Höhepunkte |
| -------------- | ---------------- | -------------------------------------------------------------------------------------- |
| 🧠**Routing & Intelligenz**| 25+ | Routing mit der niedrigsten Latenz, Tag-basiertes Routing, Quoten-Preflight, P2C-Kontoauswahl |
| 🔒**Sicherheit & Compliance**| 20+ | SSRF-Härtung, Credential-Cloaking, Ratenbegrenzung pro Endpunkt, Verwaltungsschlüssel-Scoping |
| 📊**Beobachtbarkeit**| 15+ | OpenTelemetry-Integration, Echtzeit-Kontingentüberwachung, Kostenverfolgung pro Modell |
| 🔄**Anbieterintegrationen**| 20+ | Dynamische Modellregistrierung, Anbieter-Abklingzeiten, Multi-Account-Codex, Copilot-Kontingentanalyse |
| ⚡**Leistung**| 15+ | Duale Cache-Schicht, Prompt-Cache, Antwort-Cache, Streaming-Keepalive, Batch-API |
| 🌐**Ökosystem**| 10+ | WebSocket-API, Hot-Reload der Konfiguration, verteilter Konfigurationsspeicher, kommerzieller Modus |### 🔜 Coming Soon

- 🔗**OpenCode-Integration** Native Anbieterunterstützung für die OpenCode AI-Codierungs-IDE
- 🔗**TRAE-Integration** Volle Unterstützung für das TRAE AI-Entwicklungsframework
- 📦**Batch-API** Asynchrone Stapelverarbeitung für Massenanfragen
- 🎯**Tag-basiertes Routing** Leiten Sie Anfragen basierend auf benutzerdefinierten Tags und Metadaten weiter
- 💰**Niedrigste Kostenstrategie** Wählen Sie automatisch den günstigsten verfügbaren Anbieter aus

> 📝 Vollständige Funktionsspezifikationen verfügbar unter [`docs/new-features/`](docs/new-features/) (217 detaillierte Spezifikationen)---

## 👥 Contributors

[![Contributors](https://contrib.rocks/image?repo=diegosouzapw/OmniRoute&max=100&columns=20&anon=1)](https://github.com/diegosouzapw/OmniRoute/graphs/contributors)

### How to Contribute

1. Forken Sie das Repository
2. Erstellen Sie Ihren Feature-Zweig („git checkout -b feature/amazing-feature“)
3. Übernehmen Sie Ihre Änderungen („git commit -m Erstaunliche Funktion hinzufügen“)
4. Zum Zweig pushen („git push origin feature/amazing-feature“)
5. Öffnen Sie eine Pull-Anfrage

Detaillierte Richtlinien finden Sie unter [CONTRIBUTING.md](CONTRIBUTING.md).### Releasing a New Version

```bash
# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes

📊 Star History

Stargazers over time

Stargazers over time

🙏 Acknowledgments

Besonderer Dank geht an**9routervondecolua** das ursprüngliche Projekt, das diesen Fork inspiriert hat. OmniRoute baut auf dieser unglaublichen Grundlage mit zusätzlichen Funktionen, multimodalen APIs und einer vollständigen Neufassung von TypeScript auf.

Besonderer Dank geht an**CLIProxyAPI** die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat.---

Lizenz

MIT-Lizenz Einzelheiten finden Sie unter LIZENZ.---

Built with ❤️ for developers who code 24/7
omniroute.online