mirror of https://github.com/diegosouzapw/OmniRoute.git synced 2026-04-28 06:19:46 +00:00

diegosouzapw 5085dcf96f ci: fix sonarqube config and test suite failures

2026-04-06 18:11:09 -03:00

119 KiB

Raw Blame History

🚀 OmniRoute — The Free AI Gateway (Deutsch)

🌐 Languages: 🇺🇸 English · 🇪🇸 es · 🇫🇷 fr · 🇩🇪 de · 🇮🇹 it · 🇷🇺 ru · 🇨🇳 zh-CN · 🇯🇵 ja · 🇰🇷 ko · 🇸🇦 ar · 🇮🇳 hi · 🇮🇳 in · 🇹🇭 th · 🇻🇳 vi · 🇮🇩 id · 🇲🇾 ms · 🇳🇱 nl · 🇵🇱 pl · 🇸🇪 sv · 🇳🇴 no · 🇩🇰 da · 🇫🇮 fi · 🇵🇹 pt · 🇷🇴 ro · 🇭🇺 hu · 🇧🇬 bg · 🇸🇰 sk · 🇺🇦 uk-UA · 🇮🇱 he · 🇵🇭 phi · 🇧🇷 pt-BR · 🇨🇿 cs · 🇹🇷 tr

Never stop coding. Smart routing to FREE & low-cost AI models with automatic fallback.

Ihr universeller API-Proxy – ein Endpunkt, über 60 Anbieter, keine Ausfallzeiten. Jetzt mitMCP Server (25 Tools),A2A-Protokoll,Speicher-/Skills-SystemeundElectron Desktop App.

Chat-Abschlüsse • Einbettungen • Bildgenerierung • Video • Musik • Audio • Reranking •Websuche• MCP-Server • A2A-Protokoll • 100 % TypeScript---

🌐 Website • 🚀 Schnellstart • 💡 Funktionen • 📖 Dokumente • 💰 Preise • 💬 WhatsApp

🖼️ Main Dashboard

📸 Dashboard Preview

Klicken Sie hier, um Dashboard-Screenshots anzuzeigen

Seite	Screenshot
Anbieter
Kombinationen
Analytik
Gesundheit
Übersetzer
Einstellungen
CLI-Tools
Nutzungsprotokolle
Endpunkte

🤖 Free AI Provider for your favorite coding agents

Verbinden Sie jedes KI-gestützte IDE- oder CLI-Tool über OmniRoute – kostenloses API-Gateway für unbegrenzte Codierung.

OpenClaw
_{⭐ 205K}

NanoBot
_{⭐ 20,9K}

PicoClaw
_{⭐ 14,6K}

ZeroClaw
_{⭐ 9,9K}

Eisenklaue
_{⭐ 2,1K}

OpenCode
_{⭐ 106K}

Codex-CLI
_{⭐ 60,8K}

Claude Code
_{⭐ 67,3K}

Gemini-CLI
_{⭐ 94,7K}

Kilo-Code
_{⭐ 15,5K}

_{📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 – eine Konfiguration, unbegrenzte Modelle und Kontingent}---

🤔 Why OmniRoute?

Hören Sie auf, Geld zu verschwenden und an Grenzen zu stoßen:

Das Abonnementkontingent läuft jeden Monat ungenutzt ab
Ratenbeschränkungen stoppen Sie mitten beim Codieren – Teure APIs (20–50 $/Monat pro Anbieter)
Manueller Wechsel zwischen Anbietern

OmniRoute löst dieses Problem:

✅Abonnements maximieren- Verfolgen Sie das Kontingent, nutzen Sie jedes Bit vor dem Zurücksetzen
✅Auto-Fallback– Abonnement → API-Schlüssel → Günstig → Kostenlos, keine Ausfallzeiten
✅Mehrere Konten– Round-Robin zwischen Konten pro Anbieter
✅Universell– Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw und jedem CLI-Tool---

📧 Support

💬Treten Sie unserer Community bei!WhatsApp-Gruppe – Holen Sie sich Hilfe, tauschen Sie Tipps aus und bleiben Sie auf dem Laufenden.

-Website: omniroute.online -GitHub: github.com/diegosouzapw/OmniRoute -Probleme: github.com/diegosouzapw/OmniRoute/issues -WhatsApp: Community-Gruppe -Mitwirken: Siehe CONTRIBUTING.md, öffnen Sie eine PR oder wählen Sie eine „gute erste Ausgabe“ aus -Originalprojekt: 9router von decolua### 🐛 Reporting a Bug?

Wenn Sie ein Problem öffnen, führen Sie bitte den Befehl „system-info“ aus und hängen Sie die generierte Datei an:```bash npm run system-info


Dadurch wird eine „system-info.txt“ mit Ihrer Node.js-Version, OmniRoute-Version, Betriebssystemdetails, installierten CLI-Tools (Qoder, Gemini, Claude, Codex, Antigravity, Droid usw.), Docker/PM2-Status und Systempaketen generiert – alles, was wir brauchen, um Ihr Problem schnell zu reproduzieren. Hängen Sie die Datei direkt an Ihr GitHub-Problem an.---

## 🔄 How It Works

┌─────────────┐ │ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...) │ Tool │ └──────┬──────┘ │ http://localhost:20128/v1 ↓ ┌─────────────────────────────────────────┐ │ OmniRoute (Smart Router) │ │ • Format translation (OpenAI ↔ Claude) │ │ • Quota tracking + Embeddings + Images │ │ • Auto token refresh │ └──────┬──────────────────────────────────┘ │ ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI │ ↓ quota exhausted ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc. │ ↓ budget limit ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M) │ ↓ budget limit └─→ [Tier 4: FREE] Qoder, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost


---

## 🎯 What OmniRoute Solves — 30 Real Pain Points & Use Cases

>**Jeder Entwickler, der KI-Tools verwendet, ist täglich mit diesen Problemen konfrontiert.**OmniRoute wurde entwickelt, um sie alle zu lösen – von Kostenüberschreitungen bis hin zu regionalen Blockaden, von unterbrochenen OAuth-Flüssen bis hin zu Protokollvorgängen und Unternehmensbeobachtbarkeit.

<Details>
<summary><b>💸 1. „Ich bezahle ein teures Abonnement, werde aber trotzdem durch Limits unterbrochen“</b></summary>

Entwickler zahlen 20–200 US-Dollar/Monat für Claude Pro, Codex Pro oder GitHub Copilot. Auch wenn das Kontingent bezahlt wird, gibt es eine Obergrenze – 5 Stunden Nutzung, wöchentliche Limits oder Tariflimits pro Minute. Während der Codierungssitzung reagiert der Anbieter nicht mehr und der Entwickler verliert an Fluss und Produktivität.

**So löst OmniRoute das Problem:**

-**Intelligenter 4-Stufen-Fallback**– Wenn das Abonnementkontingent aufgebraucht ist, wird automatisch zu API Key → Günstig → Kostenlos weitergeleitet, ohne dass ein manueller Eingriff erforderlich ist
-**Verfolgung von Anbieterlimits**– Zwischengespeicherte Kontingent-Snapshots werden nach einem serverseitigen Zeitplan aktualisiert (Standard „PROVIDER_LIMITS_SYNC_INTERVAL_MINUTES=70“), wobei eine manuelle Aktualisierung in der Benutzeroberfläche verfügbar ist
-**Unterstützung mehrerer Konten**– Mehrere Konten pro Anbieter mit automatischem Round-Robin – wenn eines aufgebraucht ist, wird zum nächsten gewechselt
-**Benutzerdefinierte Kombinationen**– Anpassbare Fallback-Ketten mit 9 Ausgleichsstrategien (Priorität, gewichtet, Fill-First, Round-Robin, P2C, zufällig, am wenigsten genutzt, kostenoptimiert, strikt zufällig)
-**Codex Business Quotas**– Überwachung der Geschäfts-/Team-Arbeitsbereichskontingente direkt im Dashboard</details>

<Details>
<summary><b>🔌 2. „Ich muss mehrere Anbieter nutzen, aber jeder hat eine andere API“</b></summary>

OpenAI verwendet ein Format, Claude (Anthropic) verwendet ein anderes, Gemini noch ein anderes. Wenn ein Entwickler Modelle verschiedener Anbieter testen oder zwischen ihnen wechseln möchte, muss er SDKs neu konfigurieren, Endpunkte ändern und mit inkompatiblen Formaten umgehen. Benutzerdefinierte Anbieter (FriendLI, NIM) verfügen über nicht standardmäßige Modellendpunkte.

**So löst OmniRoute das Problem:**

-**Unified Endpoint**– Ein einzelner „http://localhost:20128/v1“ dient als Proxy für alle über 60 Anbieter
-**Formatübersetzung**– Automatisch und transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
-**Antwortbereinigung**– Entfernt nicht standardmäßige Felder („x_groq“, „usage_breakdown“, „service_tier“), die OpenAI SDK v1.83+ beschädigen
-**Rollennormalisierung**– Konvertiert „Entwickler“ → „System“ für Nicht-OpenAI-Anbieter; „System“ → „Benutzer“ für GLM/ERNIE
-**Think Tag Extraction**– Extrahiert „<think>“-Blöcke aus Modellen wie DeepSeek R1 in standardisierten „reasoning_content“.
-**Strukturierte Ausgabe für Gemini**– automatische Konvertierung von „json_schema“ → „responseMimeType“/„responseSchema“.
-**`stream` ist standardmäßig auf `false`**— Entspricht der OpenAI-Spezifikation und vermeidet unerwartetes SSE in Python/Rust/Go-SDKs</details>

<Details>
<summary><b>🌐 3. „Mein KI-Anbieter blockiert meine Region/mein Land“</b></summary>

Anbieter wie OpenAI/Codex blockieren den Zugriff aus bestimmten geografischen Regionen. Benutzer erhalten bei OAuth- und API-Verbindungen Fehlermeldungen wie „unsupported_country_region_territory“. Dies ist besonders frustrierend für Entwickler aus Entwicklungsländern.

**So löst OmniRoute das Problem:**

-**3-Level-Proxy-Konfiguration**– Konfigurierbarer Proxy auf 3 Ebenen: global (gesamter Datenverkehr), pro Anbieter (nur ein Anbieter) und pro Verbindung/Schlüssel
-**Farbcodierte Proxy-Abzeichen**– Visuelle Indikatoren: 🟢 globaler Proxy, 🟡 Anbieter-Proxy, 🔵 Verbindungs-Proxy, immer mit IP-Adresse
-**OAuth-Token-Austausch über Proxy**– Der OAuth-Fluss läuft auch über den Proxy und löst „unsupported_country_region_territory“.
-**Verbindungstests über Proxy**– Verbindungstests verwenden den konfigurierten Proxy (keine direkte Umgehung mehr)
-**SOCKS5-Unterstützung**– Vollständige SOCKS5-Proxy-Unterstützung für ausgehendes Routing
-**TLS-Fingerabdruck-Spoofing**– Browserähnlicher TLS-Fingerabdruck über „wreq-js“, um die Bot-Erkennung zu umgehen
-**🔏 CLI-Fingerabdruck-Abgleich**– Ordnet Header und Textfelder neu an, damit sie mit nativen CLI-Binärsignaturen übereinstimmen, wodurch das Risiko der Kontokennzeichnung drastisch reduziert wird. Die Proxy-IP bleibt erhalten – Sie erhalten gleichzeitig Stealth**und**IP-Maskierung</details>

<Details>
<summary><b>🆓 4. „Ich möchte KI zum Codieren verwenden, habe aber kein Geld“</b></summary>

Nicht jeder kann 20–200 $/Monat für KI-Abonnements bezahlen. Studenten, Entwickler aus Schwellenländern, Bastler und Freiberufler benötigen Zugang zu hochwertigen Modellen zum Nulltarif.

**So löst OmniRoute das Problem:**

-**Integrierte Free-Tier-Anbieter**– Native Unterstützung für 100 % kostenlose Anbieter: Qoder (5 unbegrenzte Modelle über OAuth: kimi-k2-thinking, qwen3-coder-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 unbegrenzte Modelle: qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next, vision-model), Kiro (Claude + AWS Builder ID kostenlos), Gemini CLI (180.000 Token/Monat kostenlos)
-**Ollama Cloud**– Cloud-gehostete Ollama-Modelle unter „api.ollama.com“ mit kostenloser Stufe „Light-Nutzung“; Verwenden Sie das Präfix „ollamacloud/<model>“.
-**Nur kostenlose Combos**– Kette „gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus“ = 0 $/Monat ohne Ausfallzeit
-**NVIDIA NIM Free Access**– Entwickler-für immer kostenloser Zugriff auf über 70 Modelle unter build.nvidia.com mit ca. 40 U/min (Umstellung von Credits auf reine Ratenlimits)
-**Kostenoptimierte Strategie**– Routing-Strategie, die automatisch den günstigsten verfügbaren Anbieter auswählt</details>

<Details>
<summary><b>🔒 5. „Ich muss mein KI-Gateway vor unbefugtem Zugriff schützen“</b></summary>

Wenn ein KI-Gateway dem Netzwerk (LAN, VPS, Docker) zugänglich gemacht wird, kann jeder mit der Adresse die Token/Kontingente des Entwicklers verbrauchen. Ohne Schutz sind APIs anfällig für Missbrauch, sofortige Injektion und Missbrauch.

**So löst OmniRoute das Problem:**

-**API-Schlüsselverwaltung**– Generierung, Rotation und Scoping pro Anbieter mit einer dedizierten „/dashboard/api-manager“-Seite
-**Berechtigungen auf Modellebene**– Beschränken Sie API-Schlüssel auf bestimmte Modelle („openai/*“, Platzhaltermuster) mit der Umschaltfunktion „Alle zulassen/Einschränken“.
-**API Endpoint Protection**– Erfordert einen Schlüssel für „/v1/models“ und blockiert bestimmte Anbieter aus der Liste
-**Auth Guard + CSRF-Schutz**– Alle Dashboard-Routen sind mit „withAuth“-Middleware + CSRF-Tokens geschützt
-**Ratenbegrenzer**– Ratenbegrenzung pro IP mit konfigurierbaren Fenstern
-**IP-Filterung**– Zulassungs-/Blockierungsliste für die Zugriffskontrolle
-**Prompt Injection Guard**– Bereinigung gegen bösartige Eingabeaufforderungsmuster
-**AES-256-GCM-Verschlüsselung**– Anmeldeinformationen im Ruhezustand verschlüsselt</details>

<Details>
<summary><b>🛑 6. „Mein Provider ist ausgefallen und ich habe meinen Programmierfluss verloren“</b></summary>

KI-Anbieter können instabil werden, 5xx-Fehler zurückgeben oder vorübergehende Ratengrenzen erreichen. Wenn ein Entwickler von einem einzelnen Anbieter abhängig ist, wird er unterbrochen. Ohne Schutzschalter können wiederholte Versuche zum Absturz der Anwendung führen.

**So löst OmniRoute das Problem:**

-**Leistungsschalter pro Modell**– Automatisches Öffnen/Schließen mit konfigurierbaren Schwellenwerten und Abklingzeit (Geschlossen/Offen/Halboffen), je nach Modell, um kaskadierende Blöcke zu vermeiden
-**Exponentielles Backoff**– Progressive Wiederholungsverzögerungen
-**Anti-Thundering Herd**– Mutex + Semaphor-Schutz gegen gleichzeitige Wiederholungsstürme
-**Combo-Fallback-Ketten**– Wenn der primäre Anbieter ausfällt, fällt er automatisch durch die Kette, ohne dass ein Eingreifen erforderlich ist
-**Combo Circuit Breaker**– Deaktiviert automatisch ausgefallene Anbieter innerhalb einer Combo-Kette
-**Gesundheits-Dashboard**– Betriebszeitüberwachung, Leistungsschalterzustände, Sperren, Cache-Statistiken, p50/p95/p99-Latenz</details>

<Details>
<summary><b>🔧 7. „Die Konfiguration jedes KI-Tools ist mühsam und repetitiv“</b></summary>

Entwickler verwenden Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code ... Jedes Tool benötigt eine andere Konfiguration (API-Endpunkt, Schlüssel, Modell). Eine Neukonfiguration bei einem Anbieter- oder Modellwechsel ist Zeitverschwendung.

**So löst OmniRoute das Problem:**

-**CLI Tools Dashboard**– Spezielle Seite mit Ein-Klick-Einrichtung für Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
-**GitHub Copilot Config Generator**– Erzeugt „chatLanguageModels.json“ für VS-Code mit Massenmodellauswahl
-**Onboarding-Assistent**– Geführte Einrichtung in 4 Schritten für Erstbenutzer
-**Ein Endpunkt, alle Modelle**– Konfigurieren Sie „http://localhost:20128/v1“ einmal und greifen Sie auf über 60 Anbieter zu</details>

<Details>
<summary><b>🔑 8. „Die Verwaltung von OAuth-Tokens von mehreren Anbietern ist die Hölle“</b></summary>

Claude Code, Codex, Gemini CLI, Copilot – alle verwenden OAuth 2.0 mit ablaufenden Token. Entwickler müssen sich ständig neu authentifizieren, sich mit „client_secret fehlt“, „redirect_uri_mismatch“ und Fehlern auf Remote-Servern befassen. Besonders problematisch ist OAuth auf LAN/VPS.

**So löst OmniRoute das Problem:**

-**Automatische Token-Aktualisierung**– OAuth-Tokens werden vor Ablauf im Hintergrund aktualisiert
-**OAuth 2.0 (PKCE) integriert**– Automatischer Ablauf für Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, Qoder
-**Multi-Account OAuth**– Mehrere Konten pro Anbieter über JWT/ID-Token-Extraktion
-**OAuth LAN/Remote Fix**– Private IP-Erkennung für „redirect_uri“ + manueller URL-Modus für Remote-Server
-**OAuth hinter Nginx**– Verwendet „window.location.origin“ für Reverse-Proxy-Kompatibilität
-**Remote OAuth Guide**– Schritt-für-Schritt-Anleitung für Google Cloud-Anmeldeinformationen auf VPS/Docker</details>

<Details>
<summary><b>📊 9. „Ich weiß nicht, wie viel ich wo ausgebe“</b></summary>

Entwickler nutzen mehrere kostenpflichtige Anbieter, haben jedoch keine einheitliche Sicht auf die Ausgaben. Jeder Anbieter verfügt über ein eigenes Abrechnungs-Dashboard, es gibt jedoch keine konsolidierte Ansicht. Unerwartete Kosten können sich häufen.

**So löst OmniRoute das Problem:**

-**Kostenanalyse-Dashboard**– Kostenverfolgung pro Token und Budgetverwaltung pro Anbieter
-**Budgetgrenzen pro Stufe**– Ausgabenobergrenze pro Stufe, die einen automatischen Fallback auslöst
-**Preiskonfiguration pro Modell**– Konfigurierbare Preise pro Modell
-**Nutzungsstatistiken pro API-Schlüssel**– Anzahl der Anfragen und zuletzt verwendeter Zeitstempel pro Schlüssel
-**Analytics-Dashboard**– Statistikkarten, Modellnutzungsdiagramm, Anbietertabelle mit Erfolgsraten und Latenz</details>

<Details>
<summary><b>🐛 10. „Ich kann Fehler und Probleme bei KI-Aufrufen nicht diagnostizieren“</b></summary>

Wenn ein Anruf fehlschlägt, weiß der Entwickler nicht, ob es sich um eine Ratenbegrenzung, ein abgelaufenes Token, ein falsches Format oder einen Anbieterfehler handelt. Fragmentierte Protokolle über verschiedene Terminals hinweg. Ohne Beobachtbarkeit ist das Debuggen ein Versuch und Irrtum.

**So löst OmniRoute das Problem:**

-**Einheitliches Protokoll-Dashboard**– 4 Registerkarten: Anforderungsprotokolle, Proxy-Protokolle, Audit-Protokolle, Konsole
-**Console Log Viewer**– Echtzeit-Viewer im Terminal-Stil mit farbcodierten Ebenen, automatischem Scrollen, Suche und Filter
-**SQLite-Proxy-Protokolle**– Persistente Protokolle, die Serverneustarts überdauern
-**Translator Playground**– 4 Debugging-Modi: Playground (Formatübersetzung), Chat Tester (Round-Trip), Test Bench (Batch), Live Monitor (Echtzeit)
-**Telemetrie anfordern**– p50/p95/p99-Latenz + X-Request-Id-Ablaufverfolgung
-**Dateibasierte Protokollierung mit Rotation**– App-Protokolle rotieren nach Größe, Aufbewahrungstagen und Archivanzahl; Anrufprotokollartefakte rotieren nach Aufbewahrungstagen und Dateianzahl
-**Systeminfobericht**– „npm run system-info“ generiert „system-info.txt“ mit Ihrer vollständigen Umgebung (Knotenversion, OmniRoute-Version, Betriebssystem, CLI-Tools, Docker/PM2-Status). Hängen Sie es an, wenn Sie Probleme melden, um eine sofortige Einstufung zu ermöglichen.</details>

<Details>
<summary><b>🏗️ 11. „Die Bereitstellung und Wartung des Gateways ist komplex“</b></summary>

Die Installation, Konfiguration und Wartung eines KI-Proxys in verschiedenen Umgebungen (lokal, VPS, Docker, Cloud) ist arbeitsintensiv. Probleme wie hartcodierte Pfade, „EACCES“ für Verzeichnisse, Portkonflikte und plattformübergreifende Builds sorgen für zusätzliche Reibung.

**So löst OmniRoute das Problem:**

-**npm globale Installation**– „npm install -g omniroute && omniroute“ – fertig
-**Docker Multi-Platform**– AMD64 + ARM64 nativ (Apple Silicon, AWS Graviton, Raspberry Pi)
-**Docker Compose-Profile**– „base“ (keine CLI-Tools) und „cli“ (mit Claude Code, Codex, OpenClaw)
-**Electron Desktop App**– Native App für Windows/macOS/Linux mit Taskleiste, Autostart, Offline-Modus
-**Split-Port-Modus**– API und Dashboard auf separaten Ports für erweiterte Szenarien (Reverse-Proxy, Container-Netzwerk)
-**Cloud Sync**– Konfigurieren Sie die geräteübergreifende Synchronisierung über Cloudflare Workers
-**DB-Backups**– Automatische Sicherung, Wiederherstellung, Export und Import aller Einstellungen, mit „DISABLE_SQLITE_AUTO_BACKUP“ für extern verwaltete Backups</details>

<Details>
<summary><b>🌍 12. „Die Benutzeroberfläche ist nur auf Englisch verfügbar und mein Team spricht kein Englisch“</b></summary>

Teams in nicht englischsprachigen Ländern, insbesondere in Lateinamerika, Asien und Europa, haben Probleme mit rein englischsprachigen Benutzeroberflächen. Sprachbarrieren verringern die Akzeptanz und erhöhen die Zahl von Konfigurationsfehlern.

**So löst OmniRoute das Problem:**

-**Dashboard i18n – 30 Sprachen**– Alle über 500 Tasten übersetzt, einschließlich Arabisch, Bulgarisch, Dänisch, Deutsch, Spanisch, Finnisch, Französisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch (PT/BR), Rumänisch, Russisch, Slowakisch, Schwedisch, Thailändisch, Ukrainisch, Vietnamesisch, Chinesisch, Philippinisch, Englisch
-**RTL-Unterstützung**– Rechts-nach-links-Unterstützung für Arabisch und Hebräisch
-**Mehrsprachige READMEs**– 30 vollständige Dokumentationsübersetzungen
-**Sprachauswahl**– Globussymbol in der Kopfzeile zum Umschalten in Echtzeit</details>

<Details>
<summary><b>🔄 13. „Ich brauche mehr als nur Chat – ich brauche Einbettungen, Bilder, Audio“</b></summary>

KI ist nicht nur der Abschluss eines Chats. Entwickler müssen Bilder generieren, Audio transkribieren, Einbettungen für RAG erstellen, Dokumente neu einordnen und Inhalte moderieren. Jede API hat einen anderen Endpunkt und ein anderes Format.

**So löst OmniRoute das Problem:**

-**Embeddings**– „/v1/embeddings“ mit 6 Anbietern und 9+ Modellen
-**Image Generation**– „/v1/images/generations“ mit 10 Anbietern und über 20 Modellen (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
-**Text-zu-Video**– „/v1/videos/generations“ – ComfyUI (AnimateDiff, SVD) und SD WebUI
-**Text-zu-Musik**– „/v1/music/generations“ – ComfyUI (Stable Audio Open, MusicGen)
-**Audiotranskription**– „/v1/audio/transcriptions“ – Whisper + Nvidia NIM, HuggingFace, Qwen3
-**Text-to-Speech**– „/v1/audio/speech“ – ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3,**Inworld**,**Cartesia**,**PlayHT**, + bestehende Anbieter
-**Moderationen**– „/v1/moderations“ – Überprüfung der Inhaltssicherheit
-**Reranking**– „/v1/rerank“ – Neuranking der Dokumentrelevanz
-**Responses API**– Vollständige „/v1/responses“-Unterstützung für Codex</details>

<Details>
<summary><b>🧪 14. „Ich habe keine Möglichkeit, die Qualität verschiedener Modelle zu testen und zu vergleichen“</b></summary>

Entwickler möchten wissen, welches Modell für ihren Anwendungsfall am besten geeignet ist – Code, Übersetzung, Argumentation –, aber ein manueller Vergleich ist langsam. Es sind keine integrierten Evaluierungstools vorhanden.

**So löst OmniRoute das Problem:**

-**LLM-Bewertungen**– Golden-Set-Test mit 10 vorinstallierten Fällen zu Begrüßungen, Mathematik, Geografie, Codegenerierung, JSON-Konformität, Übersetzung, Markdown und Sicherheitsverweigerung
-**4 Match-Strategien**– „exact“, „contains“, „regex“, „custom“ (JS-Funktion)
-**Translator Playground Test Bench**– Batch-Tests mit mehreren Eingaben und erwarteten Ausgaben, anbieterübergreifender Vergleich
-**Chat-Tester**– Vollständiger Roundtrip mit visueller Antwortwiedergabe
-**Live-Monitor**– Echtzeit-Stream aller Anfragen, die über den Proxy fließen</details>

<Details>
<summary><b>📈 15. „Ich muss skalieren, ohne an Leistung einzubüßen“</b></summary>

Wenn das Anfragevolumen wächst, verursachen dieselben Fragen ohne Zwischenspeicherung doppelte Kosten. Ohne Idempotenz verschwenden doppelte Anfragen die Verarbeitung. Die Tarifbegrenzungen pro Anbieter müssen eingehalten werden.

**So löst OmniRoute das Problem:**

-**Semantischer Cache**– Zweistufiger Cache (Signatur + Semantik) reduziert Kosten und Latenz
-**Request Idempotency**– 5-Sekunden-Deduplizierungsfenster für identische Anfragen
-**Ratenbegrenzungserkennung**– Provider-RPM, minimale Lücke und maximale gleichzeitige Verfolgung
-**Bearbeitbare Ratengrenzen**– Konfigurierbare Standardeinstellungen unter Einstellungen → Ausfallsicherheit mit Persistenz
-**API Key Validation Cache**– 3-stufiger Cache für Produktionsleistung
-**Gesundheits-Dashboard mit Telemetrie**– p50/p95/p99-Latenz, Cache-Statistiken, Betriebszeit</details>

<Details>
<summary><b>🤖 16. „Ich möchte das Modellverhalten global steuern“</b></summary>

Entwickler, die alle Antworten in einer bestimmten Sprache oder mit einem bestimmten Ton wünschen oder die Argumentationstoken einschränken möchten. Dies in jedem Tool/jeder Anfrage zu konfigurieren, ist unpraktisch.

**So löst OmniRoute das Problem:**

-**System Prompt Injection**– Globale Eingabeaufforderung, die auf alle Anfragen angewendet wird
-**Thinking Budget Validation**– Reasoning-Token-Zuteilungskontrolle pro Anfrage (Passthrough, automatisch, benutzerdefiniert, adaptiv)
-**9 Routing-Strategien**– Globale Strategien, die bestimmen, wie Anfragen verteilt werden
-**Wildcard-Router**– „provider/*“-Muster leiten dynamisch an jeden Anbieter weiter
-**Combo-Aktivierung/Deaktivierung umschalten**– Combos direkt über das Dashboard umschalten
-**Provider Toggle**– Alle Verbindungen für einen Anbieter mit einem Klick aktivieren/deaktivieren
-**Blockierte Anbieter**– Bestimmte Anbieter aus der Liste „/v1/models“ ausschließen</details>

<Details>
<summary><b>🧰 17. „Ich brauche MCP-Tools als erstklassige Produktfunktionen“</b></summary>

Viele KI-Gateways stellen MCP nur als verstecktes Implementierungsdetail zur Verfügung. Teams benötigen eine sichtbare, überschaubare Betriebsebene.

**So löst OmniRoute das Problem:**

– MCP wird in der Dashboard-Navigation und auf der Registerkarte „Endpunktprotokoll“ angezeigt
- Dedizierte MCP-Verwaltungsseite mit Prozess, Tools, Bereichen und Audit
– Integrierter Schnellstart für „omniroute --mcp“ und Client-Onboarding</details>

<Details>
<summary><b>🧠 18. „Ich benötige A2A-Orchestrierung mit Synchronisierungs- und Stream-Aufgabenpfaden“</b></summary>

Agenten-Workflows erfordern sowohl direkte Antworten als auch eine lang andauernde gestreamte Ausführung mit Lebenszykluskontrolle.

**So löst OmniRoute das Problem:**

- A2A JSON-RPC-Endpunkt („POST /a2a“) mit „message/send“ und „message/stream“.
- SSE-Streaming mit Terminal-State-Propagierung
– Task-Lebenszyklus-APIs für „tasks/get“ und „tasks/cancel“.</details>

<Details>
<summary><b>🛰️ 19. „Ich brauche einen echten Zustand des MCP-Prozesses, keinen erratenen Status“</b></summary>

Betriebsteams müssen wissen, ob MCP tatsächlich aktiv ist, und nicht nur, ob eine API erreichbar ist.

**So löst OmniRoute das Problem:**

– Laufzeit-Heartbeat-Datei mit PID, Zeitstempeln, Transport, Werkzeuganzahl und Oszilloskopmodus
- MCP-Status-API, die Heartbeat + aktuelle Aktivität kombiniert
- UI-Statuskarten für Prozess-/Verfügbarkeits-/Heartbeat-Aktualität</details>

<Details>
<summary><b>📋 20. „Ich benötige eine überprüfbare MCP-Tool-Ausführung“</b></summary>

Wenn Tools die Konfiguration verändern oder operative Aktionen auslösen, benötigen Teams forensische Rückverfolgbarkeit.

**So löst OmniRoute das Problem:**

– SQLite-gestützte Audit-Protokollierung für MCP-Tool-Aufrufe
- Filtert nach Tool, Erfolg/Misserfolg, API-Schlüssel und Paginierung
- Dashboard-Audit-Tabelle + Statistik-Endpunkte für die Automatisierung</details>

<Details>
<summary><b>🔐 21. „Ich benötige bereichsbezogene MCP-Berechtigungen pro Integration“</b></summary>

Verschiedene Clients sollten Zugriff auf die Werkzeugkategorien mit den geringsten Rechten haben.

**So löst OmniRoute das Problem:**

- 10 granulare MCP-Bereiche für kontrollierten Werkzeugzugriff
- Geltungsbereichsdurchsetzung und Sichtbarkeit in der MCP-Management-Benutzeroberfläche
- Sichere Standardhaltung für Betriebswerkzeuge</details>

<Details>
<summary><b>⚙️ 22. „Ich brauche Betriebskontrollen ohne Umschichtung“</b></summary>

Teams benötigen bei Vorfällen oder Kostenereignissen schnelle Laufzeitänderungen.

**So löst OmniRoute das Problem:**

- Schalten Sie die Combo-Aktivierung direkt über das MCP-Dashboard um
- Wenden Sie Ausfallsicherheitsprofile aus vordefinierten Richtlinienpaketen an
- Setzen Sie den Leistungsschalterstatus über dasselbe Bedienfeld zurück</details>

<Details>
<summary><b>🔄 23. „Ich benötige Live-Sichtbarkeit und Stornierung des A2A-Aufgabenlebenszyklus“</b></summary>

Ohne Sichtbarkeit des Lebenszyklus wird es schwierig, Aufgabenvorfälle zu selektieren.

**So löst OmniRoute das Problem:**

- Aufgabenliste/Filterung nach Bundesland/Fähigkeit mit Paginierung
- Drilldown zu Aufgabenmetadaten, Ereignissen und Artefakten
- Endpunkt zum Abbrechen von Aufgaben und UI-Aktion mit Bestätigung</details>

<Details>
<summary><b>🌊 24. „Ich benötige aktive Stream-Metriken für die A2A-Last“</b></summary>

Streaming-Workflows erfordern betriebliche Einblicke in Parallelität und Live-Verbindungen.

**So löst OmniRoute das Problem:**

- Aktive Stream-Zähler im A2A-Status integriert
- Zeitstempel der letzten Aufgabe und Anzahl pro Status
- A2A-Dashboard-Karten für die Echtzeit-Betriebsüberwachung</details>

<Details>
<summary><b>🪪 25. „Ich benötige eine standardmäßige Agentenerkennung für Kunden“</b></summary>

Externe Kunden und Orchestratoren benötigen für das Onboarding maschinenlesbare Metadaten.

**So löst OmniRoute das Problem:**

– Agentenkarte unter „/.well-known/agent.json“ verfügbar gemacht
- Fähigkeiten und Fertigkeiten werden in der Management-Benutzeroberfläche angezeigt
– Die A2A-Status-API enthält Erkennungsmetadaten für die Automatisierung</details>

<Details>
<summary><b>🧭 26. „Ich benötige Protokollauffindbarkeit in der Produkt-UX“</b></summary>

Wenn Benutzer Protokolloberflächen nicht entdecken können, sinken Akzeptanz und Supportqualität.

**So löst OmniRoute das Problem:**

- Konsolidierte Seite**Endpunkte**mit Registerkarten für Proxy-, MCP-, A2A- und API-Endpunkte
- Inline-Dienststatusumschaltung (Online/Offline) für MCP und A2A
- Links von der Übersicht zu speziellen Verwaltungsregisterkarten</details>

<Details>
<summary><b>🧪 27. „Ich benötige eine End-to-End-Protokollvalidierung mit echten Clients“</b></summary>

Probetests reichen nicht aus, um die Protokollkompatibilität vor der Veröffentlichung zu überprüfen.

**So löst OmniRoute das Problem:**

– E2E-Suite, die die App startet und echten MCP SDK-Client-Transport verwendet
- A2A-Clienttests für Erkennungs-, Sende-, Stream-, Get- und Abbruchflüsse
- Vergleichen Sie Behauptungen mit MCP-Audit- und A2A-Aufgaben-APIs</details>

<Details>
<summary><b>📡 28. „Ich brauche eine einheitliche Beobachtbarkeit über alle Schnittstellen hinweg“</b></summary>

Die Aufteilung der Beobachtbarkeit nach Protokoll führt zu blinden Flecken und einer längeren MTTR.

**So löst OmniRoute das Problem:**

- Einheitliche Dashboards/Protokolle/Analysen in einem Produkt
- Gesundheits-, Audit- und Anforderungstelemetrie über OpenAI-, MCP- und A2A-Ebenen hinweg
- Operative APIs für Status und Automatisierung</details>

<Details>
<summary><b>💼 29. „Ich benötige eine Laufzeit für Proxy + Tools + Agent-Orchestrierung“</b></summary>

Die Ausführung vieler separater Dienste erhöht die Betriebskosten und erhöht die Fehlerhäufigkeit.

**So löst OmniRoute das Problem:**

- OpenAI-kompatibler Proxy, MCP-Server und A2A-Server in einem Stack
– Gemeinsame Authentifizierung, Ausfallsicherheit, Datenspeicher und Beobachtbarkeit
- Konsistentes Richtlinienmodell über alle Interaktionsoberflächen hinweg</details>

<Details>
<summary><b>🚀 30. „Ich muss Agenten-Workflows ohne Glue-Code-Wildwuchs ausliefern“</b></summary>

Teams verlieren an Geschwindigkeit, wenn sie mehrere Ad-hoc-Dienste und -Skripte zusammenfügen.

**So löst OmniRoute das Problem:**

- Einheitliche Endpunktstrategie für Kunden und Agenten
- Integrierte Protokollverwaltungs-Benutzeroberflächen und Rauchvalidierungspfade
- Produktionsreife Grundlagen (Sicherheit, Protokollierung, Ausfallsicherheit, Backup)</details>

### Example Playbooks (Integrated Use Cases)

**Playbook A: Bezahltes Abonnement maximieren + günstiges Backup**```txt
Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption

Playbook B: Kostenfreier Codierungsstack```txt Combo: "free-forever"

gc/gemini-3-flash
if/kimi-k2-thinking
qw/qwen3-coder-plus

Monthly cost: $0 Outcome: stable free coding workflow


**Playbook C: 24/7 Always-On-Fallback-Kette**```txt
Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads

Playbook D: Agenteneinsätze mit MCP + A2A```txt

Start MCP transport (omniroute --mcp) for tool-driven operations
Run A2A tasks via message/send and message/stream
Observe via /dashboard/endpoint (MCP and A2A tabs)
Toggle services via inline status controls


---

## 🆓 Start Free — Zero Configuration Cost

> Richten Sie die KI-Codierung in wenigen Minuten für**0 $/Monat**ein. Verbinden Sie diese kostenlosen Konten und nutzen Sie die integrierte**Free Stack**-Kombination.

| Schritt | Aktion | Anbieter freigeschaltet |
| ---- | ------------------------------------------------- | ----------------------------------------------------------------- |
| 1 | Verbinden Sie**Kiro**(AWS Builder ID OAuth) | Claude Sonnet 4.5, Haiku 4.5 –**unbegrenzt**|
| 2 | Verbinden Sie**Qoder**(Google OAuth) | kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... —**unbegrenzt**|
| 3 | Verbinden Sie**Qwen**(Gerätecode) | qwen3-coder-plus, qwen3-coder-flash... —**unbegrenzt**|
| 4 | Verbinden Sie**Gemini CLI**(Google OAuth) | gemini-3-flash, gemini-2.5-pro –**180.000/Monat kostenlos**|
| 5 | `/dashboard/combos` → Vorlage**Free Stack ($0)**| Round-Robin aller kostenlosen Anbieter automatisch |

**Zeigen Sie eine beliebige IDE/CLI auf:**„http://localhost:20128/v1“ · API-Schlüssel: „any-string“ · Fertig.

>**Optionale zusätzliche Abdeckung (auch kostenlos):**Groq API-Schlüssel (30 U/min kostenlos), NVIDIA NIM (40 U/min kostenlos, 70+ Modelle), Cerebras (1 Mio. Token/Tag), LongCat API-Schlüssel (50 Mio. Token/Tag!), Cloudflare Workers AI (10.000 Neuronen/Tag, 50+ Modelle).## Schnellstart

### 1) Install and run

```bash
npm install -g omniroute
omniroute

**pnpm-Benutzer:**Führen Sie nach der Installation „pnpm genehmigt-builds -g“ aus, um native Build-Skripte zu aktivieren, die für „better-sqlite3“ und „@swc/core“ erforderlich sind:

„Bash pnpm install -g omniroute pnpm genehmigt-builds -g # Alle Pakete auswählen → genehmigen Omniroute

Das Dashboard wird unter „http://localhost:20128“ geöffnet und die API-Basis-URL ist „http://localhost:20128/v1“.

Befehl	Beschreibung
`omniroute`	Server starten („PORT=20128“, API und Dashboard auf demselben Port)
`omniroute --port 3000`	Setzen Sie den kanonischen/API-Port auf 3000
`omniroute --mcp`	Starten Sie den MCP-Server (STDIO-Transport)
`omniroute --no-open`	Browser nicht automatisch öffnen
`omniroute --help`	Hilfe anzeigen

Optionaler Split-Port-Modus:```bash PORT=20128 DASHBOARD_PORT=20129 omniroute

API: http://localhost:20128/v1

Dashboard: http://localhost:20129


### Long-Running Streaming Timeouts

Für die meisten Bereitstellungen benötigen Sie lediglich:

| Variable | Standard | Zweck |
| ------------------------ | -------------- | ---------------------------------------------------------------------------------------------- |
| `REQUEST_TIMEOUT_MS` | „600000“ | Gemeinsame Baseline für Upstream-Abruf, versteckte Undici-Timeouts, TLS-Fingerprint-Anfragen und API-Bridge-Request/Proxy-Timeouts |
| `STREAM_IDLE_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ | Maximale Lücke zwischen Streaming-Blöcken, bevor OmniRoute den SSE-Stream abbricht |

Die Abwärtskompatibilität bleibt erhalten: Vorhandene „FETCH_TIMEOUT_MS“, „API_BRIDGE_PROXY_TIMEOUT_MS“ und andere Timeout-Variablen pro Ebene funktionieren weiterhin und überschreiben die gemeinsame Baseline.

Wenn Sie eine genauere Steuerung benötigen, stehen erweiterte Überschreibungen zur Verfügung:| Variable | Standard | Zweck |
| ---------------------------------------- | ------------------------------------------ | ------------------------------------------------------------------- |
| `FETCH_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ | Gesamtzeitüberschreitung der Upstream-Anforderung, die vom Hauptabrufsignal | verwendet wird
| `FETCH_HEADERS_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Undici-Zeitlimit für den Empfang von Upstream-Antwortheadern |
| `FETCH_BODY_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Undici-Zeitlimit zwischen Upstream-Body-Chunks („0“ deaktiviert es) |
| `FETCH_CONNECT_TIMEOUT_MS` | „30000“ | Undici TCP-Verbindungszeitüberschreitung |
| `FETCH_KEEPALIVE_TIMEOUT_MS` | „4000“ | Undici Leerlauf-Keep-Alive-Socket-Timeout |
| `TLS_CLIENT_TIMEOUT_MS` | erbt „FETCH_TIMEOUT_MS“ | Zeitüberschreitung für TLS-Fingerabdruckanfragen über „wreq-js“ |
| `API_BRIDGE_PROXY_TIMEOUT_MS` | erbt „REQUEST_TIMEOUT_MS“ oder „30000“ | Zeitüberschreitung für „/v1“-Proxy-Weiterleitung vom API-Port zum Dashboard-Port |
| `API_BRIDGE_SERVER_REQUEST_TIMEOUT_MS` | `max(API_BRIDGE_PROXY_TIMEOUT_MS, 300000)` | Zeitüberschreitung bei eingehenden Anfragen auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_HEADERS_TIMEOUT_MS` | „60000“ | Zeitüberschreitung beim eingehenden Header auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_KEEPALIVE_TIMEOUT_MS` | „5000“ | Keep-Alive-Timeout auf dem API-Bridge-Server |
| `API_BRIDGE_SERVER_SOCKET_TIMEOUT_MS` | `0` | Zeitüberschreitung bei Socket-Inaktivität auf dem API-Bridge-Server („0“ deaktiviert ihn) |

Wenn Sie OmniRoute hinter Nginx, Caddy, Cloudflare oder einem anderen Reverse-Proxy ausführen, stellen Sie sicher, dass der Proxy vorhanden ist
Die Zeitüberschreitungen sind auch höher als die Zeitüberschreitungen für Ihren OmniRoute-Stream/Abruf.### 2) Connect providers and create your API key

1. Öffnen Sie Dashboard → „Anbieter“ und verbinden Sie mindestens einen Anbieter (OAuth oder API-Schlüssel).
2. Öffnen Sie Dashboard → „Endpunkte“ und erstellen Sie einen API-Schlüssel.
3. (Optional) Öffnen Sie Dashboard → „Combos“ und legen Sie Ihre Fallback-Kette fest.### 3) Point your coding tool to OmniRoute

```txt
Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)

Funktioniert mit Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode und OpenAI-kompatiblen SDKs.### 4) Enable and validate protocols (v2.0)

MCP (für werkzeuggesteuerte Vorgänge):```bash omniroute --mcp


Verbinden Sie dann Ihren MCP-Client über „stdio“ und testen Sie Tools wie:

- `omniroute_get_health`
- `omniroute_list_combos`

**A2A (für Agent-zu-Agent-Workflows):**```bash
curl http://localhost:20128/.well-known/agent.json

curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'

5) Validate everything end-to-end (recommended)

npm run test:protocols:e2e

Diese Suite validiert echte MCP- und A2A-Client-Flows anhand einer laufenden App.### Alternative: run from source

cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev

Void Linux (Vorlage „xbps-src“)

Für Void-Linux-Benutzer können Sie mit „xbps-src“ ein natives Paket erstellen. Speichern Sie diesen Block als „srcpkgs/omniroute/template“:```bash

Template file for 'omniroute'

pkgname=omniroute version=3.4.1 revision=1 hostmakedepends="nodejs python3 make" depends="openssl" short_desc="Universal AI gateway with smart routing for multiple LLM providers" maintainer="zenobit zenobit@disroot.org" license="MIT" homepage="https://github.com/diegosouzapw/OmniRoute" distfiles="https://github.com/diegosouzapw/OmniRoute/archive/refs/tags/v${version}.tar.gz" checksum=009400afee90a9f32599d8fe734145cfd84098140b7287990183dde45ae2245b system_accounts="_omniroute" omniroute_homedir="/var/lib/omniroute" export NODE_ENV=production export npm_config_engine_strict=false export npm_config_loglevel=error export npm_config_fund=false export npm_config_audit=false

do_build() { # Determine target CPU arch for node-gyp local _gyp_arch case "$XBPS_TARGET_MACHINE" in aarch64*) _gyp_arch=arm64 ;; armv7*|armv6*) _gyp_arch=arm ;; i686*) _gyp_arch=ia32 ;; *) _gyp_arch=x64 ;; esac

# 1) Install all deps – skip scripts (no network in do_build, native modules
#    compiled separately below; better-sqlite3 is serverExternalPackage so
#    Next.js does not execute it during next build)
NODE_ENV=development npm ci --ignore-scripts

# 2) Build the Next.js standalone bundle
npm run build

# 3) Copy static assets into standalone
cp -r .next/static .next/standalone/.next/static
[ -d public ] && cp -r public .next/standalone/public || true

# 4) Compile better-sqlite3 native binding for the target architecture.
#    Use node-gyp directly so CC/CXX from xbps-src cross-toolchain are used
#    without npm altering them.
local _node_gyp=/usr/lib/node_modules/npm/node_modules/node-gyp/bin/node-gyp.js
(cd node_modules/better-sqlite3 && node "$_node_gyp" rebuild --arch="$_gyp_arch")

# 5) Place the compiled binding into the standalone bundle
local _bs3_release=.next/standalone/node_modules/better-sqlite3/build/Release
mkdir -p "$_bs3_release"
cp node_modules/better-sqlite3/build/Release/better_sqlite3.node "$_bs3_release/"

# 6) Remove arch-specific sharp bundles – upstream sets images.unoptimized=true
#    so sharp is not used at runtime; x64 .so files would break aarch64 strip
rm -rf .next/standalone/node_modules/@img

# 7) Copy pino runtime deps omitted by Next.js static analysis:
#    pino-abstract-transport – required by pino's worker thread
#    split2 – dep of pino-abstract-transport
#    process-warning – dep of pino itself
for _mod in pino-abstract-transport split2 process-warning; do
	cp -r "node_modules/$_mod" .next/standalone/node_modules/
done

}

do_check() { npm run test:unit }

do_install() { vmkdir usr/lib/omniroute/.next

vcopy .next/standalone/. usr/lib/omniroute/.next/standalone

# Prevent removal of empty Next.js app router dirs by the post-install hook
for _d in \
	.next/standalone/.next/server/app/dashboard \
	.next/standalone/.next/server/app/dashboard/settings \
	.next/standalone/.next/server/app/dashboard/providers; do
	touch "${DESTDIR}/usr/lib/omniroute/${_d}/.keep"
done

cat > "${WRKDIR}/omniroute" <<'EOF'

#!/bin/sh export PORT="${PORT:-20128}" export DATA_DIR="${DATA_DIR:-${XDG_DATA_HOME:-${HOME}/.local/share}/omniroute}" export LOG_TO_FILE="${LOG_TO_FILE:-false}" mkdir -p "${DATA_DIR}" exec node /usr/lib/omniroute/.next/standalone/server.js "$@" EOF vbin "${WRKDIR}/omniroute" }

post_install() { vlicense LICENSE }


</details>

---

## 🐳 Docker

OmniRoute ist als öffentliches Docker-Image auf [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute) verfügbar.

**Schneller Lauf:**```bash
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --stop-timeout 40 \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Umgebungsdatei:```bash

Copy and edit .env first

cp .env.example .env

docker run -d
--name omniroute
--restart unless-stopped
--stop-timeout 40
--env-file .env
-p 20128:20128
-v omniroute-data:/app/data
diegosouzapw/omniroute:latest


**Verwendung von Docker Compose:**```bash
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d

Die Dashboard-Unterstützung für Docker-Bereitstellungen umfasst jetzt einenCloudflare Quick Tunnelmit einem Klick unter „Dashboard → Endpunkte“. Die erste Aktivierung lädt „cloudflared“ nur bei Bedarf herunter, startet einen temporären Tunnel zu Ihrem aktuellen „/v1“-Endpunkt und zeigt die generierte „https://*.trycloudflare.com/v1“-URL direkt unter Ihrer normalen öffentlichen URL an.

Hinweise:

Quick Tunnel-URLs sind temporär und ändern sich nach jedem Neustart. – Quick Tunnels werden nach einem OmniRoute- oder Container-Neustart nicht automatisch wiederhergestellt. Aktivieren Sie sie bei Bedarf über das Dashboard erneut. – Die verwaltete Installation unterstützt derzeit Linux, macOS und Windows auf „x64“ / „arm64“. – Managed Quick Tunnels verwenden standardmäßig den HTTP/2-Transport, um laute QUIC-UDP-Pufferwarnungen in eingeschränkten Containerumgebungen zu vermeiden. Stellen Sie „CLOUDFLARED_PROTOCOL=quic“ oder „auto“ ein, wenn Sie einen anderen Transport wünschen.
Docker-Images bündeln System-CA-Roots und übergeben sie an verwaltetes „Cloudflared“, wodurch TLS-Vertrauensfehler vermieden werden, wenn der Tunnel innerhalb des Containers bootet.
SQLite läuft im WAL-Modus. „Docker Stop“ sollte abgeschlossen werden dürfen, damit OmniRoute die neuesten Änderungen zurück in „storage.sqlite“ überprüfen kann. – Die gebündelten Compose-Dateien legen bereits eine Stoppfrist von 40 Sekunden fest. Wenn Sie das Image direkt ausführen, behalten Sie „--stop-timeout 40“ (oder ähnlich) bei, damit manuelle Stopps die Bereinigung beim Herunterfahren nicht unterbrechen.
Legen Sie „CLOUDFLARED_BIN=/absolute/path/to/cloudflared“ fest, wenn OmniRoute eine vorhandene Binärdatei verwenden soll, anstatt eine herunterzuladen.

Verwendung von Docker Compose mit Caddy (HTTPS Auto-TLS):

OmniRoute kann mithilfe der automatischen SSL-Bereitstellung von Caddy sicher verfügbar gemacht werden. Stellen Sie sicher, dass der DNS-A-Eintrag Ihrer Domain auf die IP Ihres Servers verweist.```yaml services: omniroute: image: diegosouzapw/omniroute:latest container_name: omniroute restart: unless-stopped volumes: - omniroute-data:/app/data environment: - PORT=20128 - NEXT_PUBLIC_BASE_URL=https://your-domain.com

caddy: image: caddy:latest container_name: caddy restart: unless-stopped ports: - "80:80" - "443:443" command: caddy reverse-proxy --from https://your-domain.com --to http://omniroute:20128

volumes: omniroute-data:


| Bild | Tag | Größe | Beschreibung |
| ------------------------ | -------- | ------ | --------------------- |
| `diegosouzapw/omniroute` | `neueste` | ~250 MB | Neueste stabile Version |
| `diegosouzapw/omniroute` | `1.0.3` | ~250 MB | Aktuelle Version |---

## 🖥️ Desktop App — Offline & Always-On

> 🆕**NEU!**OmniRoute ist jetzt als**native Desktop-Anwendung**für Windows, macOS und Linux verfügbar.

Führen Sie OmniRoute als eigenständige Desktop-App aus – kein Terminal, kein Browser, keine Internetverbindung für lokale Modelle erforderlich. Die Electron-basierte App umfasst:

- 🖥️**Natives Fenster**– Spezielles App-Fenster mit Integration in die Taskleiste
- 🔄**Auto-Start**– OmniRoute bei der Systemanmeldung starten
- 🔔**Native Benachrichtigungen**– Erhalten Sie Benachrichtigungen bei Kontingentausschöpfung oder Anbieterproblemen
- ⚡**One-Click-Installation**– NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐**Offline-Modus**– Funktioniert vollständig offline mit dem gebündelten Server### Schnellstart

```bash
# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)

System Tray

Wenn OmniRoute minimiert ist, befindet es sich mit schnellen Aktionen in Ihrer Taskleiste:

Dashboard öffnen
Server-Port ändern
Anwendung beenden

📖 Vollständige Dokumentation: electron/README.md---

💰 Pricing at a Glance

Stufe	Anbieter	Kosten	Kontingent zurücksetzen	Am besten für
💳 ABO	Claude Code (Pro)	20 $/Monat	5h + wöchentlich	Bereits abonniert
	Codex (Plus/Pro)	20–200 $/Monat	5h + wöchentlich	OpenAI-Benutzer
	Gemini CLI	KOSTENLOS	180.000/Monat + 1.000/Tag	Alle!
	GitHub-Copilot	10–19 $/Monat	Monatlich	GitHub-Benutzer
🔑 API-SCHLÜSSEL	NVIDIA NIM	KOSTENLOS(für immer entwickeln)	~40 U/min	Über 70 offene Modelle
	Großhirn	KOSTENLOS(1 Mio. tok/Tag)	60.000 TPM / 30 U/min	Der schnellste der Welt
	Groq	KOSTENLOS(30 U/min)	14,4K RPD	Ultraschnelles Lama/Gemma
	DeepSeek V3.2	0,27 `/1,10` pro 1 Mio.	Keine	Bestes Preis-Leistungs-Verhältnis
	xAI Grok-4 Schnell	0,20 `/0,50` pro 1 Mio.🆕	Keine	Schnellster + Werkzeugaufruf, ultraniedrig
	xAI Grok-4 (Standard)	0,20 `/1,50` pro 1 Mio. 🆕	Keine	Argumentations-Flaggschiff von xAI
	Mistral	Kostenlose Testversion + kostenpflichtig	Tarif begrenzt	Europäische KI
	OpenRouter	Pay-per-Use	Keine	Über 100 Modelle aggr.
💰 GÜNSTIG	GLM-5 (über Z.AI) 🆕	0,5 $/1 Mio.	Täglich 10 Uhr	128K-Ausgabe, neuestes Flaggschiff
	GLM-4.7	0,6 $/1 Mio.	Täglich 10 Uhr	Budgetsicherung
	MiniMax M2.5 🆕	0,3 $/1 Mio. Eingabe	5-Stunden-Rollen	Argumentation + Agentenaufgaben
	MiniMax M2.1	0,2 $/1 Mio.	5-Stunden-Rollen	Günstigste Option
	Kimi K2.5 (Moonshot API) 🆕	Pay-per-Use	Keine	Direkter Zugriff auf die Moonshot-API
	Kimi K2	$9/Monat pauschal	10 Millionen Token/Monat	Vorhersehbare Kosten
🆓 KOSTENLOS	Qoder	$0	Unbegrenzt	5 Modelle unbegrenzt
	Qwen	$0	Unbegrenzt	4 Modelle unbegrenzt
	Kiro	$0	Unbegrenzt	Claude Sonnet/Haiku (AWS Builder)
	LongCat Flash-Lite 🆕	$0(50 Mio. Token/Tag 🔥)	1 RPS	Größte kostenlose Quote der Welt
	Bestäubungs-KI 🆕	$0(kein Schlüssel erforderlich)	1 Anforderung/15s	GPT-5, Claude, DeepSeek, Lama 4
	Cloudflare Workers AI 🆕	$0(10.000 Neuronen/Tag)	~150 resp/Tag	Über 50 Modelle, globaler Vorsprung
	Scaleway AI 🆕	0 $(insgesamt 1 Mio. Token)	Tarif begrenzt	EU/DSGVO, Qwen3 235B, Lama 70B	> 🆕Neue Modelle hinzugefügt (März 2026):Grok-4 Fast-Familie für 0,20 $/0,50 $/M (Benchmark bei 1143 ms – 30 % schneller als Gemini 2.5 Flash), GLM-5 über Z.AI mit 128K-Ausgabe, MiniMax M2.5-Argumentation, aktualisierte Preise für DeepSeek V3.2, Kimi K2.5 über die direkte Moonshot-API.

💡 0 $ Combo Stack – Das komplette kostenlose Setup:```

🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever

Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED Qoder (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED LongCat Lite (lc/) → LongCat-Flash-Lite — 50M tokens/day 🔥 Pollinations (pol/) → GPT-5, Claude, DeepSeek, Llama 4 — no key needed Qwen (qw/) → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED Gemini (gemini/) → Gemini 2.5 Flash — 1,500 req/day free API key Cloudflare AI (cf/) → Llama 70B, Gemma 3, Mistral — 10K Neurons/day Scaleway (scw/) → Qwen3 235B, Llama 70B — 1M free tokens (EU) Groq (groq/) → Llama/Gemma ultra-fast — 14.4K req/day NVIDIA NIM (nvidia/) → 70+ open models — 40 RPM forever Cerebras (cerebras/) → Llama/Qwen world-fastest — 1M tok/day


**Kostenlos. Hört nie auf zu programmieren.**Konfigurieren Sie dies als eine OmniRoute-Kombination und alle Fallbacks erfolgen automatisch – kein manuelles Umschalten.---

---

## 🆓 Free Models — What You Actually Get

> Alle unten aufgeführten Modelle sind**100 % kostenlos, keine Kreditkarte erforderlich**. OmniRoute leitet automatisch zwischen ihnen weiter, wenn ein Kontingent aufgebraucht ist – kombinieren Sie sie alle für eine unzerstörbare 0-Dollar-Kombination.### 🔵 CLAUDE MODELS (via Kiro — AWS Builder ID)

| Modell | Präfix | Grenze | Ratenbegrenzung |
| ------------------- | ------ | ------------- | --------------------- |
| `claude-sonett-4.5` | `kr/` |**Unbegrenzt**| Keine gemeldete Tagesobergrenze |
| `claude-haiku-4.5` | `kr/` |**Unbegrenzt**| Keine gemeldete Tagesobergrenze |
| `claude-opus-4.6` | `kr/` |**Unbegrenzt**| Neuestes Werk von Kiro |### 🟢 QODER MODELS (Free PAT via qodercli)

| Modell | Präfix | Grenze | Ratenbegrenzung |
| ------------------- | ------ | ------------- | --------------- |
| `kimi-k2-thinking` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-plus` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `deepseek-r1` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `minimax-m2.1` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `kimi-k2` | `if/` |**Unbegrenzt**| Keine gemeldete Obergrenze |

> Empfohlene Verbindungsmethode:**Persönliches Zugriffstoken + „qodercli“**. Browser OAuth ist
> experimentell und standardmäßig deaktiviert, es sei denn, die Umgebungsvariablen „QODER_OAUTH_*“ sind konfiguriert.### 🟡 QWEN MODELS (Device Code Auth)

| Modell | Präfix | Grenze | Ratenlimit |
| ------------------- | ------ | ------------- | ------------------- |
| `qwen3-coder-plus` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-flash` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| `qwen3-coder-next` | `qw/` |**Unbegrenzt**| Keine gemeldete Obergrenze |
| „Vision-Modell“ | `qw/` |**Unbegrenzt**| Multimodal (Bilder) |### 🟣 GEMINI CLI (Google OAuth)

| Modell | Präfix | Grenze | Ratenlimit |
| ------------------------ | ------ | ------------ | ------------- |
| `gemini-3-flash-preview` | `gc/` |**180.000 Token/Monat**+ 1.000/Tag | Monatlicher Reset |
| `gemini-2.5-pro` | `gc/` | 180.000/Monat (gemeinsamer Pool) | Hohe Qualität |### ⚫ NVIDIA NIM (Free API Key — build.nvidia.com)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---------- | ------------ | ----------- | ----------------------------------------------------- |
| Kostenlos (Entwickler) | Keine Token-Obergrenze |**~40 U/min**| Über 70 Modelle; Übergang zu reinen Tarifbegrenzungen Mitte 2025 |

Beliebte kostenlose Modelle: „moonshotai/kimi-k2.5“ (Kimi K2.5), „z-ai/glm4.7“ (GLM 4.7), „deepseek-ai/deepseek-v3.2“ (DeepSeek V3.2), „nvidia/llama-3.3-70b-instruct“, „deepseek/deepseek-r1“.### ⚪ CEREBRAS (Free API Key — inference.cerebras.ai)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---- | ----------------- | ---------------- | ------------------------------------------- |
| Kostenlos |**1 Mio. Token/Tag**| 60.000 TPM / 30 U/min | Weltweit schnellste LLM-Inferenz; wird täglich zurückgesetzt |

Kostenlos erhältlich: „llama-3.3-70b“, „llama-3.1-8b“, „deepseek-r1-distill-llama-70b“.### 🔴 GROQ (Free API Key — console.groq.com)

| Stufe | Tageslimit | Ratenlimit | Notizen |
| ---- | ------------- | ---------------- | ----------------------------------------- |
| Kostenlos |**14,4K RPD**| 30 U/min pro Modell | Keine Kreditkarte; 429 auf Limit, nicht berechnet |

Kostenlos erhältlich: „llama-3.3-70b-versatile“, „gemma2-9b-it“, „mixtral-8x7b“, „whisper-large-v3“.### 🔴 LONGCAT AI (Free API Key — longcat.chat) 🆕

| Modell | Präfix | Tägliches kostenloses Kontingent | Notizen |
| -------------- | ------ | ----------------- | --------- |
| `LongCat-Flash-Lite` | `lc/` |**50 Millionen Token**💥 | Größtes kostenloses Kontingent aller Zeiten |
| `LongCat-Flash-Chat` | `lc/` | 500.000 Token | Multi-Turn-Chat |
| „LongCat-Flash-Thinking“ | `lc/` | 500.000 Token | Begründung / CoT |
| `LongCat-Flash-Thinking-2601` | `lc/` | 500.000 Token | Version Januar 2026 |
| „LongCat-Flash-Omni-2603“ | `lc/` | 500.000 Token | Multimodal |

> 100 % kostenlos während der öffentlichen Beta. Melden Sie sich per E-Mail oder Telefon bei [longcat.chat](https://longcat.chat) an. Wird täglich um 00:00 UTC zurückgesetzt.### 🟢 POLLINATIONS AI (No API Key Required) 🆕

| Modell | Präfix | Ratenlimit | Anbieter dahinter |
| ---------- | ------ | ---------- | ------------------- |
| `openai` | `pol/` | 1 Anforderung/15s | GPT-5 |
| `Claude` | `pol/` | 1 Anforderung/15s | Anthropischer Claude |
| „Zwillinge“ | `pol/` | 1 Anforderung/15s | Google Gemini |
| `deepseek` | `pol/` | 1 Anforderung/15s | DeepSeek V3 |
| `Lama` | `pol/` | 1 Anforderung/15s | Meta Lama 4 Scout |
| „Mistral“ | `pol/` | 1 Anforderung/15s | Mistral KI |

> ✨**Keine Reibung:**Keine Anmeldung, kein API-Schlüssel. Fügen Sie den Bestäubungsanbieter mit einem leeren Schlüsselfeld hinzu und es funktioniert sofort.### 🟠 CLOUDFLARE WORKERS AI (Free API Key — cloudflare.com) 🆕

| Stufe | Tägliche Neuronen | Äquivalente Verwendung | Notizen |
| ---- | ------------- | --------------------------------------- | --------- |
| Kostenlos |**10.000**| ~150 LLM bzw. 500 Sek. Audio / 15.000 Einbettungen | Global Edge, 50+ Modelle |

Beliebte kostenlose Modelle: „@cf/meta/llama-3.3-70b-instruct“, „@cf/google/gemma-3-12b-it“, „@cf/openai/whisper-large-v3-turbo“ (kostenloses Audio!), „@cf/qwen/qwen2.5-coder-15b-instruct“.

> Erfordert API-Token + Konto-ID von [dash.cloudflare.com](https://dash.cloudflare.com). Konto-ID in den Anbietereinstellungen hinterlegen.### 🟣 SCALEWAY AI (1M Free Tokens — scaleway.com) 🆕

| Stufe | Kostenloses Kontingent | Standort | Notizen |
| ---- | ------------- | ------------ | ----------------------------------- |
| Kostenlos |**1 Mio. Token**| 🇫🇷 Paris, EU | Innerhalb der Grenzen ist keine Kreditkarte erforderlich |

Kostenlos verfügbar: „qwen3-235b-a22b-instruct-2507“ (Qwen3 235B!), „llama-3.1-70b-instruct“, „mistral-small-3.2-24b-instruct-2506“, „deepseek-v3-0324“.

> EU/DSGVO-konform. Holen Sie sich den API-Schlüssel unter [console.scaleway.com](https://console.scaleway.com).

>**💡 Der ultimative kostenlose Stack (11 Anbieter, 0 $ für immer):**
>
> ```
> Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED
> Qoder (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
> LongCat Lite (lc/) → LongCat-Flash-Lite – 50 Millionen Token/Tag 🔥
> Bestäubungen (pol/) → GPT-5, Claude, DeepSeek, Llama 4 – kein Schlüssel erforderlich
> Qwen (qw/) → qwen3-Coder-Modelle UNBEGRENZT
> Gemini (gemini/) → Gemini 2.5 Flash – 1.500 Req/Tag kostenlos
> Cloudflare AI (cf/) → 50+ Modelle – 10.000 Neuronen/Tag
> Scaleway (scw/) → Qwen3 235B, Llama 70B – 1 Mio. kostenlose Token (EU)
> Groq (groq/) → Lama/Gemma – 14,4K req/Tag ultraschnell
> NVIDIA NIM (nvidia/) → 70+ offene Modelle – 40 U/min für immer
> Großhirn (Großhirn) → Lama/Qwen weltweit am schnellsten – 1 Mio. tok/Tag
> ```## 🎙️ Free Transcription Combo

> Transkribieren Sie jedes Audio/Video für**0 $**– Deepgram führt mit 200 $ kostenlos, AssemblyAI 50 $ Fallback, Groq Whisper als unbegrenztes Notfall-Backup.

| Anbieter | Kostenlose Credits | Bestes Modell | Ratenlimit |
| ----------------- | ---------------------- | -------------------------------------------- | ------------- |
| 🟢**Deepgram**|**200 $ gratis**(Anmeldung) | „nova-3“ – beste Genauigkeit, über 30 Sprachen | Kein RPM-Limit für kostenlose Credits |
| 🔵**AssemblyAI**|**50 $ gratis**(Anmeldung) | „universal-3-pro“ – Kapitel, Stimmung, PII | Kein RPM-Limit für kostenlose Credits |
| 🔴**Groq**|**Für immer kostenlos**| „whisper-large-v3“ – OpenAI Whisper | 30 U/min (Geschwindigkeit begrenzt) |

**Vorgeschlagene Kombination in „/dashboard/combos“:**```
Name: free-transcription
Strategy: Priority
Nodes:
  [1] deepgram/nova-3          → uses $200 free first
  [2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
  [3] groq/whisper-large-v3    → free forever, emergency fallback

Dann unter „/dashboard/media“ → Registerkarte „Transkription“: Laden Sie eine beliebige Audio- oder Videodatei hoch → wählen Sie Ihren Kombinationsendpunkt aus → erhalten Sie Transkriptionen in unterstützten Formaten.## 💡 Key Features

OmniRoute v2.0 ist als Betriebsplattform konzipiert und nicht nur als Relay-Proxy.### 🆕 New — ClawRouter-Inspired Improvements (Mar 2026)

Funktion	Was es tut
⚡Grok-4 Fast Family	xAI-Modelle für 0,20 $/0,50 $/M – im Benchmarking 1143 ms (30 % schneller als Gemini 2.5 Flash)
🧠GLM-5 über Z.AI	128K-Ausgabekontext, 0,5 $/1 Mio. – neuestes Flaggschiff der GLM-Familie
🔮MiniMax M2.5	Argumentation + Agentenaufgaben für 0,30 $/1 Mio. – deutliche Verbesserung gegenüber M2.1
🎯toolCalling Flag pro Modell	Pro Modell „toolCalling: true/false“ in der Registrierung – AutoCombo überspringt nicht-toolfähige Modelle
🌍Mehrsprachige Absichtserkennung	PT/ZH/ES/AR-Schlüsselwörter in der AutoCombo-Bewertung – bessere Modellauswahl für nicht-englische Inhalte
📊Benchmark-gesteuerte Fallbacks	Echte p95-Latenz aus der Kombinationsbewertung von Live-Anfrage-Feeds – AutoCombo lernt aus tatsächlichen Daten
🔁Deduplizierung anfordern	Content-Hash-basiertes Dedup-Fenster – Multi-Agent-sicher, verhindert doppelte Gebühren
🔌Pluggable RouterStrategy	Erweiterbare „RouterStrategy“-Schnittstelle – benutzerdefinierte Routing-Logik als Plugins hinzufügen	### 🚀 Previous v2.0.9+ — Playground, CLI Fingerprints & ACP

Funktion	Was es tut
🎮Modellspielplatz	Dashboard-Seite zum direkten Testen jedes Modells – Anbieter-/Modell-/Endpunkt-Selektoren, Monaco-Editor, Streaming, Abbruch, Timing
🔏CLI-Fingerabdruckabgleich	Header-/Body-Reihenfolge pro Anbieter, um mit nativen CLI-Signaturen übereinzustimmen – schalten Sie pro Anbieter unter „Einstellungen“ > „Sicherheit“ um.Ihre Proxy-IP bleibt erhalten
🤝ACP-Unterstützung (Agent Client Protocol)	CLI-Agent-Erkennung (Codex, Claude, Goose, Gemini CLI, OpenClaw + 9 weitere), Prozess-Spawner, „/api/acp/agents“-Endpunkt
🤖ACP-Agenten-Dashboard	Debuggen › Seite „Agenten“ – Raster mit 14 Agenten mit Installationsstatus, Version und benutzerdefiniertem Agentenformular für jedes CLI-Tool.OpenCode-Benutzer erhalten eine Schaltfläche „Opencode.json herunterladen“, die automatisch eine gebrauchsfertige Konfiguration mit allen verfügbaren Modellen generiert.
🔧Benutzerdefiniertes Modell „apiFormat“-Routing	Benutzerdefinierte Modelle mit „apiFormat: „responses““ werden jetzt korrekt an den Responses-API-Übersetzer weitergeleitet
🏢Codex Workspace Isolation	Mehrere Codex-Arbeitsbereiche pro E-Mail – OAuth trennt Verbindungen korrekt nach Arbeitsbereichs-ID
🔄Electron Auto-Update	Desktop-App sucht nach Updates + automatische Installation beim Neustart	### 🤖 Agent & Protocol Operations (v2.0)

Funktion	Was es tut
🔧MCP-Server (25 Tools)	IDE/Agent-Tools über 3 Transporte: stdio, SSE (`/api/mcp/sse`), Streamable HTTP (`/api/mcp/stream`). 18 Kerne + 3 Speicher + 4 Fertigkeitswerkzeuge
🤝A2A-Server (JSON-RPC + SSE)	Ausführung von Agent-zu-Agent-Aufgaben mit Synchronisierungs- und Streaming-Flows
🧭Consolidated Endpoints-Seite	Verwaltungsseite mit Registerkarten mit den Registerkarten „Endpunkt-Proxy“, „MCP“, „A2A“ und „API-Endpunkte“
🎚️Service-Aktivierung/Deaktivierung	EIN/AUS-Schalter für MCP und A2A mit Einstellungspersistenz (Standard: AUS)
🛰️MCP Runtime Heartbeat	Echter Prozessstatus (PID, Betriebszeit, Heartbeat-Alter, Transport, Scope-Modus)
📋MCP Audit Trail	Filterbare Audit-Protokolle mit Erfolg/Misserfolg und Schlüsselzuordnung
🔐Durchsetzung des MCP-Geltungsbereichs	10 granulare Umfangsberechtigungen für kontrollierten Werkzeugzugriff
📡A2A Task Lifecycle Management	Aufgaben auflisten/filtern, Ereignisse/Artefakte prüfen, laufende Aufgaben abbrechen
📋Agentenkartenerkennung	`/.well-known/agent.json` für die automatische Client-Erkennung
🧪Protokoll-E2E-Testkabel	Echtes MCP SDK + A2A-Client fließt in „test:protocols:e2e“
⚙️Betriebskontrollen	Schaltkombination, Anwenden von Resilienzprofilen, Zurücksetzen von Leistungsschaltern über eine Bedienoberfläche	### 🧠 Routing & Intelligence

Funktion	Was es tut
🎯Intelligenter 4-Stufen-Fallback	Automatische Route: Abonnement → API-Schlüssel → Günstig → Kostenlos
📊Kontingentverfolgung in Echtzeit	Live-Token-Zählung + Reset-Countdown pro Anbieter
🔄Formatübersetzung	OpenAI ↔ Claude ↔ Gemini ↔ Antworten mit schemasicheren Konvertierungen
👥Unterstützung mehrerer Konten	Mehrere Konten pro Anbieter mit intelligenter Auswahl
🔄Automatische Token-Aktualisierung	OAuth-Token werden bei Wiederholung automatisch aktualisiert
🎨Benutzerdefinierte Kombinationen	9 Ausgleichsstrategien + Fallback-Kettenkontrolle
🌐Wildcard-Router	`provider/*` dynamisches Routing
🧠Budgetkontrollen denken	Passthrough-, automatische, benutzerdefinierte und adaptive Reasoning-Grenzwerte
🔀Modell-Aliase	Integrierte + benutzerdefinierte Modell-Aliasing- und Migrationssicherheit
⚡Hintergrundverschlechterung	Hintergrundaufgaben mit niedriger Priorität an günstigere Modelle weiterleiten
🧪Aufgabenbewusstes Smart Routing	Modell automatisch nach Inhaltstyp auswählen (Codierung/Vision/Analyse/Zusammenfassung)
🔄A2A-Agent-Workflows	Deterministischer FSM-Orchestrator für zustandsbehaftete mehrstufige Agentenausführungen
🔀Adaptives Routing	Dynamische Strategieüberschreibung basierend auf Token-Volumen und Prompt-Komplexität
🎲Anbietervielfalt	Shannon-Entropiebewertung, die die Verteilung des Auto-Combo-Verkehrs ausgleicht
💬System-Prompt-Injektion	Globale Verhaltenskontrollen werden konsequent angewendet
📄Antwort-API-Kompatibilität	Vollständige „/v1/responses“-Unterstützung für Codex und erweiterte Agenten-Workflows	### 🎵 Multi-Modal APIs

Funktion	Was es tut
🖼️Bilderzeugung	`/v1/images/generations` mit Cloud- und lokalen Backends
📐Einbettungen	`/v1/embeddings` für Such- und RAG-Pipelines
🎤Audio-Transkription	„/v1/audio/transcriptions“ – 7 Anbieter (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), automatische Spracherkennung, MP4/MP3/WAV-Unterstützung
🔊Text-to-Speech	„/v1/audio/speech“ – 10 Anbieter (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) mit korrekten Fehlermeldungen
🎬Videogenerierung	`/v1/videos/generations` (ComfyUI + SD WebUI-Workflows)
🎵Musikgeneration	`/v1/music/generations` (ComfyUI-Workflows)
🛡️Moderationen	`/v1/moderations` Sicherheitsüberprüfungen
🔀Neueinstufung	`/v1/rerank` für Relevanzbewertung
🔍Websuche🆕	„/v1/search“ – 5 Anbieter (Serper, Brave, Perplexity, Exa, Tavily), 6.500+ kostenlos/Monat, automatisches Failover, Cache	### 🛡️ Resilience, Security & Governance

Funktion	Was es tut
🔌Leistungsschalter	Auslösung/Wiederherstellung pro Modell mit Schwellenwertkontrollen
🎯Endpunktfähige Modelle	Benutzerdefinierte Modelle deklarieren unterstützte Endpunkte + API-Format
🛡️Anti-Donnerende Herde	Mutex- und Semaphorschutz bei Wiederholungs-/Ratenereignissen
🧠Semantik + Signatur-Cache	Kosten-/Latenzreduzierung mit zwei Cache-Schichten
⚡Idempotenz anfordern	Doppeltes Schutzfenster
🔒TLS-Fingerabdruck-Spoofing	Browserähnlicher TLS-Fingerabdruck –reduziert die Bot-Erkennung und Kontokennzeichnung
🔏CLI-Fingerabdruckabgleich	Entspricht nativen CLI-Anfragesignaturen –reduziert das Verbotsrisiko und behält gleichzeitig die Proxy-IP bei
🌐IP-Filterung	Zulassungs-/Blocklistenkontrolle für exponierte Bereitstellungen
📊Bearbeitbare Ratenlimits	Konfigurierbare globale/Provider-Level-Limits mit Persistenz
📉Anmutige Degradierung	Mehrschichtige Fallbacks zum Schutz des Kern-Gateway-Betriebs
📜Audit-Trail konfigurieren	Diff-basierte Änderungsverfolgung verhindert betriebliche Abweichungen durch einfache Rollbacks
⏳Provider Health Sync	Proaktive Überwachung des Token-Ablaufs, die Warnungen vor Autorisierungsfehlern auslöst
🚪Gesperrte Konten automatisch deaktivieren	Funktionsfähiger Leistungsschalter, der dauerhaft gesperrte Token-Konten automatisch verschließt
🔑API-Schlüsselverwaltung + Scoping	Sichere Schlüsselausgabe/-rotation und Modell-/Anbieterkontrollen
👁️Scoped API Key Reveal🆕	Opt-in-Wiederherstellung von API-Schlüsseln über „ALLOW_API_KEY_REVEAL“
🛡️Geschützte „/Modelle“	Optionales Authentifizierungs-Gating und Provider-Ausblenden für Modellkatalog	### 📊 Observability & Analytics

Funktion	Was es tut
📝Anfrage + Proxy-Protokollierung	Vollständige Anfrage/Antwort- und Proxy-Protokollierung
📉Gestreamte detaillierte Protokolle🆕	Rekonstruiert SSE-Nutzlastströme sauber in der Benutzeroberfläche
📋Einheitliches Protokoll-Dashboard	Anforderungs-, Proxy-, Audit- und Konsolenansichten auf einer Seite
🔍Telemetrie anfordern	p50/p95/p99-Latenz und Anforderungsverfolgung
🏥Gesundheits-Dashboard	Betriebszeit, Breaker-Zustände, Sperrungen, Cache-Statistiken
💰Kostenverfolgung	Budgetkontrolle und Preistransparenz pro Modell
📈Analysevisualisierungen	Einblicke in die Modell-/Anbieternutzung und Trendansichten
🧪Bewertungsrahmen	Golden-Set-Test mit konfigurierbaren Match-Strategien
📡Live-Diagnose🆕	Semantische Cache-Umgehung für genaue Combo-Live-Tests	### ☁️ Deployment & Platform

Funktion	Was es tut
🌐Überall bereitstellen	Localhost, VPS, Docker, Cloud-Umgebungen
🚇Cloudflare-Tunnel🆕	Quick-Tunnel-Integration mit einem Klick über das Dashboard
🔑API-Schlüsselmodellfilterung	Native /v1/models-Antwort gefiltert über zugewiesene Bearer-Kontextrollen
⚡Smart Cache Bypass	Konfigurierbare TTL-Heuristik und erzwungene Refetch-Kontrollen
🔄Sichern/Wiederherstellen	Export-/Import- und Disaster-Recovery-Abläufe
🧙Onboarding-Assistent	Erstmaliges geführtes Setup
🔧CLI-Tools-Dashboard	Ein-Klick-Setup für beliebte Codierungstools
🎮Modellspielplatz	Testen Sie alle Anbieter/Modelle/Endpunkte über das Dashboard
🔏CLI-Fingerabdruck-Umschaltung	Fingerabdruckabgleich pro Anbieter unter Einstellungen > Sicherheit
🌐i18n (30 Sprachen)	Vollständige Sprachunterstützung für Dashboard und Dokumente mit RTL-Abdeckung
🧹Alle Modelle löschen	Löschen der Modellliste in den Anbieterdetails mit einem Klick
👁️Sidebar-Steuerelemente🆕	Komponenten und Integrationen in den Darstellungseinstellungen ausblenden
📋Problemvorlagen	Standardisierte GitHub-Vorlagen für Fehler und Funktionen
📂Benutzerdefiniertes Datenverzeichnis	„DATA_DIR“-Überschreibung für Speicherort	### Feature Deep Dive

Smart fallback with practical cost control

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6
  2. nvidia/llama-3.3-70b
  3. glm/glm-4.7
  4. if/kimi-k2-thinking

Wenn Kontingent, Rate oder Integrität fehlschlagen, wechselt OmniRoute automatisch zum nächsten Kandidaten, ohne dass ein manueller Wechsel erforderlich ist.#### Protocol management that is visible and operable

MCP + A2A sind in der Benutzeroberfläche und in den Dokumenten erkennbar (nicht ausgeblendet)
Protokollstatus-APIs stellen Live-Betriebsdaten bereit (/api/mcp/*, /api/a2a/*)
Dashboards umfassen Aktionen für Tag-2-Operationen (Kombinationsumschaltung, Zurücksetzen von Leistungsschaltern, Aufgabenabbruch).#### Translator + validation workflow

Der Übersetzerbereich umfasst:

-Spielplatz: Transformationsprüfungen anfordern -Chat-Tester: vollständiger Anfrage-/Antwort-Roundtrip -Prüfstand: mehrere Fälle in einem Durchgang -Live Monitor: Echtzeit-Verkehrsansicht

Plus Protokollvalidierung mit echten Clients über „npm run test:protocols:e2e“.

📖MCP Server README– Tool-Referenz, IDE-Konfigurationen und Client-Beispiele

📖A2A Server README– Fähigkeiten, JSON-RPC-Methoden, Streaming und Aufgabenlebenszyklus## 🧪 Evaluations (Evals)

OmniRoute umfasst ein integriertes Bewertungsframework zum Testen der LLM-Antwortqualität anhand eines Golden Sets. Greifen Sie darauf überAnalytics → Evalsim Dashboard zu.### Built-in Golden Set

Das vorinstallierte „OmniRoute Golden Set“ enthält Testfälle für:

Grüße, Mathematik, Geographie, Codegenerierung
Einhaltung des JSON-Formats, Übersetzung, Markdown-Generierung
Sicherheitsverweigerung (schädlicher Inhalt), Zählung, boolesche Logik### Evaluation Strategies

Strategie	Beschreibung	Beispiel
„genau“	Die Ausgabe muss genau mit	übereinstimmen „4“
„enthält“	Die Ausgabe muss eine Teilzeichenfolge enthalten (Groß-/Kleinschreibung wird nicht beachtet)	„Paris“
`regex`	Die Ausgabe muss mit dem Regex-Muster	übereinstimmen `"1.2.3"`
„Benutzerdefiniert“	Benutzerdefinierte JS-Funktion gibt true/false	zurück `(Ausgabe) => Ausgabelänge > 10`	---

📖 Setup Guide

Protocol Setup (MCP + A2A)

🧩 MCP-Setup (Model Context Protocol)

Starten Sie den MCP-Transport im Standardmodus:```bash omniroute --mcp


Empfohlener Validierungsablauf:

1. Verbinden Sie Ihren MCP-Client über stdio.
2. Führen Sie „omniroute_get_health“ aus.
3. Führen Sie „omniroute_list_combos“ aus.
4. Öffnen Sie „/dashboard/mcp“, um Heartbeat, Aktivität und Audit zu bestätigen.

Nützliche APIs für die Automatisierung:

- `GET /api/mcp/status`
- `GET /api/mcp/tools`
- `GET /api/mcp/audit`
- `GET /api/mcp/audit/stats`</details>

<Details>
<summary><b>🤝 A2A-Setup (Agent2Agent)</b></summary>

Entdecken Sie den Agenten:```bash
curl http://localhost:20128/.well-known/agent.json

Senden Sie eine Aufgabe:```bash curl -X POST http://localhost:20128/a2a
-H 'content-type: application/json'
-d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'


Lebenszyklus verwalten:

- `GET /api/a2a/status`
- `GET /api/a2a/tasks`
- `GET /api/a2a/tasks/:id`
- `POST /api/a2a/tasks/:id/cancel`

Operative Benutzeroberfläche:

- „/dashboard/a2a“ für Aufgaben-/Status-/Stream-Beobachtbarkeit und Smoke-Aktionen</details>

<Details>
<summary><b>🧪 End-to-End-Protokollvalidierung</b></summary>

Validieren Sie beide Protokolle mit echten Clients:```bash
npm run test:protocols:e2e

Dies bestätigt:

MCP SDK-Client-Verbindung/Liste/Anruf
A2A-Erkennung/Senden/Streamen/Get/Abbrechen
Vergleichen Sie die Daten in MCP-Audit- und A2A-Aufgabenverwaltungs-APIs

💳 Abonnementanbieter

### Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

**Profi-Tipp:**Verwenden Sie Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute verfolgt das Kontingent pro Modell!### OpenAI Codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Codex Account Limit Management (5h + Weekly)

Für jedes Codex-Konto gibt es jetzt Richtlinienumschaltungen unter „Dashboard -> Anbieter“:

„5h“ (EIN/AUS): Erzwingt die 5-Stunden-Fensterschwellenrichtlinie.
„Wöchentlich“ (EIN/AUS): Erzwingen Sie die wöchentliche Fensterschwellenrichtlinie. – Schwellenwertverhalten: Wenn ein aktiviertes Fenster eine Nutzung von >=90 % erreicht, wird dieses Konto übersprungen.
Rotationsverhalten: OmniRoute leitet automatisch zum nächsten berechtigten Codex-Konto weiter.
Zurücksetzungsverhalten: Wenn die „resetAt“-Zeit des Anbieters verstrichen ist, wird das Konto automatisch wieder berechtigt.

Szenarien:

„5 Stunden EIN“ + „Wöchentlich EIN“: Das Konto wird übersprungen, wenn eines der Fenster den Schwellenwert erreicht.
„5h AUS“ + „Wöchentlich EIN“: Nur wöchentliche Nutzung kann das Konto sperren.
„5h EIN“ + „Wöchentlich AUS“: Nur eine 5-stündige Nutzung kann das Konto sperren.
„resetAt“ übergeben: Das Konto wechselt automatisch wieder in die Rotation (keine manuelle erneute Aktivierung).### Gemini CLI (FREE 180K/month!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

**Bester Wert:**Riesiges kostenloses Kontingent! Verwenden Sie dies vor kostenpflichtigen Stufen.### GitHub Copilot

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3.1-pro-preview

🔑 API-Schlüsselanbieter

### NVIDIA NIM (FREE developer access — 70+ models)

Registrieren Sie sich: build.nvidia.com
Holen Sie sich einen kostenlosen API-Schlüssel (1000 Inferenz-Credits inbegriffen)
Dashboard → Anbieter hinzufügen → NVIDIA NIM:
- API-Schlüssel: „nvapi-your-key“.

Modelle:„nvidia/llama-3.3-70b-instruct“, „nvidia/mistral-7b-instruct“ und mehr als 50 weitere

**Profi-Tipp:**OpenAI-kompatible API – funktioniert nahtlos mit der Formatübersetzung von OmniRoute!### DeepSeek

Registrieren Sie sich: platform.deepseek.com
Holen Sie sich den API-Schlüssel
Dashboard → Anbieter hinzufügen → DeepSeek

Modelle:deepseek/deepseek-chat, deepseek/deepseek-coder### Groq (Free Tier Available!)

Registrieren Sie sich: console.groq.com
Holen Sie sich den API-Schlüssel (kostenloses Kontingent inbegriffen)
Dashboard → Anbieter hinzufügen → Groq

Modelle:„groq/llama-3.3-70b“, „groq/mixtral-8x7b“.

**Profi-Tipp:**Ultraschnelle Inferenz – am besten für Echtzeit-Codierung!### OpenRouter (100+ Models)

Registrieren Sie sich: openrouter.ai
Holen Sie sich den API-Schlüssel
Dashboard → Anbieter hinzufügen → OpenRouter

**Modelle:**Greifen Sie über einen einzigen API-Schlüssel auf über 100 Modelle aller großen Anbieter zu.

Dashboard-Verhalten:OpenRouter-Modelle werden überVerfügbare Modelleverwaltet. Durch manuelles Hinzufügen, Importieren und automatische Synchronisieren wird dieselbe Liste aktualisiert.

💰 Günstige Anbieter (Backup)

### GLM-4.7 (Daily reset, $0.6/1M)

Registrieren Sie sich: Zhipu AI
Holen Sie sich den API-Schlüssel vom Coding Plan
Dashboard → API-Schlüssel hinzufügen:
- Anbieter: glm
- API-Schlüssel: „Ihr-Schlüssel“.

Verwenden Sie:glm/glm-4.7

**Profi-Tipp:**Coding Plan bietet 3× Kontingent zu 1/7 Kosten! Täglich um 10:00 Uhr zurückgesetzt.### MiniMax M2.1 (5h reset, $0.20/1M)

Registrieren Sie sich: MiniMax
Holen Sie sich den API-Schlüssel
Dashboard → API-Schlüssel hinzufügen

Verwenden Sie:„minimax/MiniMax-M2.1“.

**Profi-Tipp:**Günstigste Option für langen Kontext (1 Mio. Token)!### Kimi K2 ($9/month flat)

Abonnieren: Moonshot AI
Holen Sie sich den API-Schlüssel
Dashboard → API-Schlüssel hinzufügen

Verwendung:kimi/kimi-latest

**Profi-Tipp:**Festpreis: 9 $/Monat für 10 Mio. Token = 0,90 $/1 Mio. effektive Kosten!

🆓 KOSTENLOSE Anbieter (Notfall-Backup)

### Qoder (5 FREE models via OAuth)

Dashboard → Connect Qoder
→ Qoder OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (4 FREE models via Device Code)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude FREE)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5

🎨 Combos erstellen

### Example 1: Maximize Subscription → Cheap Backup

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Example 2: Free-Only (Zero Cost)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 CLI-Integration

### Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Verwenden Sie die SeiteCLI-Toolsim Dashboard für die Ein-Klick-Konfiguration oder bearbeiten Sie „~/.claude/settings.json“ manuell.### Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

OpenClaw

Option 1 – Dashboard (empfohlen):``` Dashboard → CLI Tools → OpenClaw → Select Model → Apply


**Option 2 – Manuell:**Bearbeiten Sie „~/.openclaw/openclaw.json“:```json
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

**Hinweis:**OpenClaw funktioniert nur mit lokaler OmniRoute. Verwenden Sie „127.0.0.1“ anstelle von „localhost“, um Probleme mit der IPv6-Auflösung zu vermeiden.### Cline / Continue / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

OpenCode

**Schritt 1:**OmniRoute als benutzerdefinierten Anbieter hinzufügen:```bash opencode /connect

Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key


**Schritt 2:**Erstellen/bearbeiten Sie „opencode.json“ in Ihrem Projektstammverzeichnis:```json
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "omniroute": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OmniRoute",
      "options": {
        "baseURL": "http://localhost:20128/v1"
      },
      "models": {
        "cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
        "gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
        "if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
      }
    }
  }
}

**Schritt 3:**Wählen Sie das Modell in OpenCode aus:```bash /models

Select any OmniRoute model from the list


>**Tipp:**Fügen Sie alle in Ihrem OmniRoute-Endpunkt „/v1/models“ verfügbaren Modelle zum Abschnitt „Modelle“ hinzu. Verwenden Sie das Format „Anbieter/Modell-ID“ aus Ihrem OmniRoute-Dashboard.</details>

---

## Fehlerbehebung

<Details>
<summary><b>Klicken Sie hier, um die Anleitung zur Fehlerbehebung zu erweitern</b></summary>

**„Sprachmodell hat keine Nachrichten bereitgestellt“**

- Anbieterkontingent erschöpft → Überprüfen Sie den Dashboard-Kontingent-Tracker
- Lösung: Combo-Fallback verwenden oder auf günstigere Stufe wechseln

**Ratenbegrenzung**

- Abonnementkontingent aufgebraucht → Fallback auf GLM/MiniMax
- Kombination hinzufügen: „cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking“.

**OAuth-Token abgelaufen**

- Automatische Aktualisierung durch OmniRoute
- Wenn die Probleme weiterhin bestehen: Dashboard → Anbieter → Verbindung wiederherstellen

**Hohe Kosten**

- Überprüfen Sie die Nutzungsstatistiken im Dashboard → Kosten
- Primärmodell auf GLM/MiniMax umstellen
- Nutzen Sie den kostenlosen Tarif (Gemini CLI, Qoder) für unkritische Aufgaben

**Dashboard-/API-Ports sind falsch**

- „PORT“ ist der kanonische Basisport (und standardmäßig API-Port)
– „API_PORT“ überschreibt nur den OpenAI-kompatiblen API-Listener
– „DASHBOARD_PORT“ überschreibt nur den Dashboard/Next.js-Listener
- Setzen Sie „NEXT_PUBLIC_BASE_URL“ auf Ihr Dashboard/öffentliche URL (für OAuth-Rückrufe)

**Cloud-Synchronisierungsfehler**

- Überprüfen Sie, ob „BASE_URL“ auf Ihre laufende Instanz verweist
– Überprüfen Sie, ob „CLOUD_URL“ auf Ihren erwarteten Cloud-Endpunkt verweist
- Halten Sie die Werte von „NEXT_PUBLIC_*“ an den serverseitigen Werten ausgerichtet

**Erste Anmeldung funktioniert nicht**

- Überprüfen Sie „INITIAL_PASSWORD“ in „.env“.
- Wenn nicht festgelegt, lautet das Fallback-Passwort „123456“.

**Keine Anfrageprotokolle**

– Anforderungsartefakte werden als eine JSON-Datei pro Anforderung in „DATA_DIR/call_logs/“ geschrieben
- Aktivieren Sie die Pipeline-Erfassung über Dashboard → Protokolle → Protokolle anfordern, wenn Sie detaillierte Payloads pro Phase benötigen
- Legen Sie „APP_LOG_TO_FILE=true“ fest, wenn Sie auch Anwendungskonsolenprotokolle in „logs/application/app.log“ haben möchten
- Passen Sie „APP_LOG_MAX_FILE_SIZE“, „APP_LOG_RETENTION_DAYS“, „APP_LOG_MAX_FILES“ und „CALL_LOG_MAX_ENTRIES“ nach Bedarf an

**Verbindungstest zeigt „Ungültig“ für OpenAI-kompatible Anbieter**

– Viele Anbieter stellen keinen „/models“-Endpunkt bereit
– OmniRoute v1.0.6+ beinhaltet eine Fallback-Validierung über Chat-Abschlüsse
– Stellen Sie sicher, dass die Basis-URL das Suffix „/v1“ enthält### 🔐 OAuth on a Remote Server

<a name="oauth-on-a-remote-server"></a>
<a name="oauth-em-server-remoto"></a>

>**⚠️ Wichtig für Benutzer, die OmniRoute auf einem VPS, Docker oder einem anderen Remote-Server ausführen**#### Why does Antigravity / Gemini CLI OAuth fail on remote servers?

Die Anbieter**Antigravity**und**Gemini CLI**verwenden**Google OAuth 2.0**. Google verlangt, dass „redirect_uri“ im OAuth-Flow genau mit einem der vorregistrierten URIs in der Google Cloud Console der App übereinstimmt.

Die in OmniRoute gebündelten OAuth-Anmeldeinformationen werden**nur für „localhost“**registriert. Wenn Sie auf OmniRoute auf einem Remote-Server zugreifen (z. B. „https://omniroute.myserver.com“), lehnt Google die Authentifizierung mit Folgendem ab:```
Error 400: redirect_uri_mismatch

Solution: Configure your own OAuth credentials

Sie müssen in der Google Cloud Console eineOAuth 2.0-Client-IDmit dem URI Ihres Servers erstellen.#### Step-by-step

1. Öffnen Sie die Google Cloud Console

Gehen Sie zu: https://console.cloud.google.com/apis/credentials

2. Erstellen Sie eine neue OAuth 2.0-Client-ID

Klicken Sie auf**„+ Anmeldeinformationen erstellen“→„OAuth-Client-ID“**
Anwendungstyp:„Webanwendung“
Name: beliebig (z. B. „OmniRoute Remote“)

3. Autorisierte Weiterleitungs-URIs hinzufügen

Fügen Sie im Feld**"Autorisierte Weiterleitungs-URIs"**Folgendes hinzu:``` https://your-server.com/callback


> Ersetzen Sie „Ihr-Server.com“ durch die Domäne oder IP Ihres Servers (geben Sie bei Bedarf den Port ein, z. B. „http://45.33.32.156:20128/callback“).

**4. Speichern und kopieren Sie die Anmeldeinformationen**

Nach der Erstellung zeigt Google die**Client-ID**und das**Client-Geheimnis**an.

**5. Umgebungsvariablen festlegen**

In Ihrer „.env“ (oder Docker-Umgebungsvariablen):```bash
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

# For Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret

6. OmniRoute neu starten```bash

npm:

npm run dev

Docker:

docker restart omniroute


**7. Versuchen Sie erneut, eine Verbindung herzustellen**

Dashboard → Anbieter → Antigravity (oder Gemini CLI) → OAuth

Google leitet jetzt korrekt zu „https://your-server.com/callback“ weiter.---

#### Temporary workaround (without custom credentials)

Wenn Sie jetzt keine eigenen Anmeldeinformationen einrichten möchten, können Sie dennoch den**manuellen URL-Ablauf**verwenden:

1. OmniRoute öffnet die Google-Autorisierungs-URL
2. Nach der Autorisierung versucht Google, auf „localhost“ umzuleiten (was auf dem Remote-Server fehlschlägt).
3.**Kopieren Sie die vollständige URL**aus der Adressleiste Ihres Browsers (auch wenn die Seite nicht geladen wird)
4. Fügen Sie diese URL in das Feld ein, das im OmniRoute-Verbindungsmodal angezeigt wird
5. Klicken Sie auf**„Verbinden“**

> Dies funktioniert, weil der Autorisierungscode in der URL unabhängig davon gültig ist, ob die Weiterleitungsseite geladen wurde.---

<Details>
<summary><b>🇧🇷 Versão em Português</b></summary>#### Por que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Wir haben**Antigravity**und**Gemini CLI**mit**Google OAuth 2.0**zur Authentifizierung getestet. Google erwartet, dass „redirect_uri“ kein OAuth-Fluss verwendet, da**exatamente**ein URI vorab in die Google Cloud Console aufgenommen wurde.

Als OAuth-Anmelder wurde OmniRoute nicht als „localhost“**registriert. Wenn Sie auf einen Remote-Server (z. B. „https://omniroute.meuservidor.com“) auf OmniRoute zugreifen, lehnt Google die Authentifizierung ab:```
Error 400: redirect_uri_mismatch

Solução: Configure suas próprias credenciais OAuth

Sie schreiben bitte eineOAuth 2.0-Client-IDin der Google Cloud Console mit einem URI für Ihren Server.#### Passo a passo

1. Zugriff auf die Google Cloud Console

Abra: https://console.cloud.google.com/apis/credentials

2. Rufen Sie eine neue OAuth 2.0-Client-ID auf

Klicken Sie auf**"+ Anmeldeinformationen erstellen"→"OAuth-Client-ID"**
Anwendungstyp:„Webanwendung“
Name: Wählen Sie einen beliebigen Namen (z. B. „OmniRoute Remote“)

3. Adicione als autorisierte Weiterleitungs-URIs

Nein,"Autorisierte Weiterleitungs-URIs", Zusatz:``` https://seu-servidor.com/callback


> Ersetzen Sie Ihren Server durch „seu-servidor.com“ oder die IP Ihres Servers (einschließlich der erforderlichen Portierung, z. B. „http://45.33.32.156:20128/callback“).

**4. Als Anmeldedaten speichern und kopieren**

Anschließend hat Google die**Client-ID**und das**Client-Geheimnis**angezeigt.

**5. Als Umgebungsvariationen konfigurieren**

Kein `.env` (oder mehrere Docker-Umgebungsvarianten):```bash
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

6. Neuzugang zu OmniRoute```bash

Se usando npm:

npm run dev

Se usando Docker:

docker restart omniroute


**7. Tente conectar novamente**

Dashboard → Anbieter → Antigravity (oder Gemini CLI) → OAuth

Dann leiten Sie Google direkt an „https://seu-servidor.com/callback“ weiter und überprüfen Sie die Funktion.---

#### Workaround temporário (sem configurar credenciais próprias)

Wenn Sie vorab keine Berechtigung erhalten möchten, besteht die Möglichkeit, das**URL-Handbuch**zu verwenden:

1. OmniRoute ruft eine von Google autorisierte URL auf
2. Nachdem Sie den Autor autorisiert haben, sendet Google eine Weiterleitung an „localhost“ (das bedeutet, dass Sie den Server nicht weiterleiten können).
3.**Kopieren Sie eine vollständige URL**, um sie in Ihren Browser zu laden (bitte beachten Sie, dass die Seite noch nicht abgeschlossen ist).
4. Geben Sie die URL ein, die nicht zur Verbindung mit OmniRoute verwendet werden soll
5. Klicken Sie auf**„Connect“**

> Diese Problemumgehung funktioniert aufgrund des Autorisierungscodes auf der URL und ist unabhängig von der Weiterleitung oder Nicht-Weiterleitung gültig.</details>

---

</details>

## 🛠️ Tech Stack

<Details>
<summary><b>Klicken Sie hier, um die Tech-Stack-Details zu erweitern</b></summary>

-**Laufzeit**: Node.js 18–22 LTS (⚠️ Node.js 24+ wird**nicht unterstützt**– native Binärdateien von „better-sqlite3“ sind inkompatibel)
-**Sprache**: TypeScript 5.9 –**100 % TypeScript**über „src/“ und „open-sse/“ (kein „any“ in Kernmodulen seit Version 2.0)
-**Framework**: Next.js 16 + React 19 + Tailwind CSS 4
-**Datenbank**: LowDB (JSON) + SQLite (Domänenstatus + Proxy-Protokolle + MCP-Prüfung + Routing-Entscheidungen)
-**Schemas**: Zod (MCP-Tool-I/O-Validierung, API-Verträge)
-**Protokolle**: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
-**Streaming**: Vom Server gesendete Ereignisse (SSE)
-**Auth**: OAuth 2.0 (PKCE) + JWT + API-Schlüssel + MCP-bezogene Autorisierung
-**Testen**: Node.js-Testläufer + Vitest (über 900 Tests einschließlich Einheit, Integration, E2E)
-**CI/CD**: GitHub-Aktionen (automatische NPM-Veröffentlichung + Docker Hub bei Veröffentlichung)
-**Website**: [omniroute.online](https://omniroute.online)
-**Paket**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute)
-**Docker**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute)
-**Resilienz**: Leistungsschalter, exponentielles Backoff, Anti-Donner-Herde, TLS-Spoofing, automatische Kombinations-Selbstheilung</details>

---

## Dokumentation

| Dokument | Beschreibung |
| ---------------------------------------------- | --------------------------------------------------- |
| [Benutzerhandbuch](docs/USER_GUIDE.md) | Anbieter, Kombinationen, CLI-Integration, Bereitstellung |
| [API-Referenz](docs/API_REFERENCE.md) | Alle Endpunkte mit Beispielen |
| [MCP-Server](open-sse/mcp-server/README.md) | 16 MCP-Tools, IDE-Konfigurationen, Python/TS/Go-Clients |
| [A2A-Server](src/lib/a2a/README.md) | JSON-RPC 2.0-Protokoll, Fähigkeiten, Streaming, Aufgabenverwaltung |
| [Auto-Combo-Engine](docs/auto-combo.md) | 6-Faktor-Bewertung, Moduspakete, Selbstheilung |
| [Fehlerbehebung](docs/TROUBLESHOOTING.md) | Häufige Probleme und Lösungen |
| [Architektur](docs/ARCHITECTURE.md) | Systemarchitektur und Interna |
| [Mitwirken](CONTRIBUTING.md) | Entwicklungsaufbau und Richtlinien |
| [OpenAPI-Spezifikation](docs/openapi.yaml) | OpenAPI 3.0-Spezifikation |
| [Sicherheitsrichtlinie](SECURITY.md) | Schwachstellenmeldung und Sicherheitspraktiken |
| [VM-Bereitstellung](docs/VM_DEPLOYMENT_GUIDE.md) | Vollständige Anleitung: VM + Nginx + Cloudflare-Setup |
| [Features-Galerie](docs/FEATURES.md) | Visuelle Dashboard-Tour mit Screenshots |
| [Release-Checkliste](docs/RELEASE_CHECKLIST.md) | Validierungsschritte vor der Veröffentlichung |---

## 🗺️ Roadmap

Für OmniRoute sind**210+ Funktionen**in mehreren Entwicklungsphasen geplant. Hier sind die Schlüsselbereiche:

| Kategorie | Geplante Funktionen | Höhepunkte |
| -------------- | ---------------- | -------------------------------------------------------------------------------------- |
| 🧠**Routing & Intelligenz**| 25+ | Routing mit der niedrigsten Latenz, Tag-basiertes Routing, Quoten-Preflight, P2C-Kontoauswahl |
| 🔒**Sicherheit & Compliance**| 20+ | SSRF-Härtung, Credential-Cloaking, Ratenbegrenzung pro Endpunkt, Verwaltungsschlüssel-Scoping |
| 📊**Beobachtbarkeit**| 15+ | OpenTelemetry-Integration, Echtzeit-Kontingentüberwachung, Kostenverfolgung pro Modell |
| 🔄**Anbieterintegrationen**| 20+ | Dynamische Modellregistrierung, Anbieter-Abklingzeiten, Multi-Account-Codex, Copilot-Kontingentanalyse |
| ⚡**Leistung**| 15+ | Duale Cache-Schicht, Prompt-Cache, Antwort-Cache, Streaming-Keepalive, Batch-API |
| 🌐**Ökosystem**| 10+ | WebSocket-API, Hot-Reload der Konfiguration, verteilter Konfigurationsspeicher, kommerzieller Modus |### 🔜 Coming Soon

- 🔗**OpenCode-Integration**– Native Anbieterunterstützung für die OpenCode AI-Codierungs-IDE
- 🔗**TRAE-Integration**– Volle Unterstützung für das TRAE AI-Entwicklungsframework
- 📦**Batch-API**– Asynchrone Stapelverarbeitung für Massenanfragen
- 🎯**Tag-basiertes Routing**– Leiten Sie Anfragen basierend auf benutzerdefinierten Tags und Metadaten weiter
- 💰**Niedrigste Kostenstrategie**– Wählen Sie automatisch den günstigsten verfügbaren Anbieter aus

> 📝 Vollständige Funktionsspezifikationen verfügbar unter [`docs/new-features/`](docs/new-features/) (217 detaillierte Spezifikationen)---

## 👥 Contributors

[![Contributors](https://contrib.rocks/image?repo=diegosouzapw/OmniRoute&max=100&columns=20&anon=1)](https://github.com/diegosouzapw/OmniRoute/graphs/contributors)

### How to Contribute

1. Forken Sie das Repository
2. Erstellen Sie Ihren Feature-Zweig („git checkout -b feature/amazing-feature“)
3. Übernehmen Sie Ihre Änderungen („git commit -m ‚Erstaunliche Funktion hinzufügen‘“)
4. Zum Zweig pushen („git push origin feature/amazing-feature“)
5. Öffnen Sie eine Pull-Anfrage

Detaillierte Richtlinien finden Sie unter [CONTRIBUTING.md](CONTRIBUTING.md).### Releasing a New Version

```bash
# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes

📊 Star History

Stargazers over time

🙏 Acknowledgments

Besonderer Dank geht an**9routervondecolua**– das ursprüngliche Projekt, das diesen Fork inspiriert hat. OmniRoute baut auf dieser unglaublichen Grundlage mit zusätzlichen Funktionen, multimodalen APIs und einer vollständigen Neufassung von TypeScript auf.

Besonderer Dank geht an**CLIProxyAPI**– die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat.---

Lizenz

MIT-Lizenz – Einzelheiten finden Sie unter LIZENZ.---

_{Built with ❤️ for developers who code 24/7}
_{omniroute.online}

119 KiB Raw Blame History Unescape Escape

🚀 OmniRoute — The Free AI Gateway (Deutsch)

Never stop coding. Smart routing to FREE & low-cost AI models with automatic fallback.

🖼️ Main Dashboard

📸 Dashboard Preview

🤖 Free AI Provider for your favorite coding agents

🤔 Why OmniRoute?

📧 Support

API: http://localhost:20128/v1

Dashboard: http://localhost:20129

5) Validate everything end-to-end (recommended)

Template file for 'omniroute'

Copy and edit .env first

System Tray

💰 Pricing at a Glance

🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever

Smart fallback with practical cost control

📖 Setup Guide

Protocol Setup (MCP + A2A)

Codex Account Limit Management (5h + Weekly)

Qwen (4 FREE models via Device Code)

Kiro (Claude FREE)

Example 2: Free-Only (Zero Cost)

Claude Code

OpenClaw

OpenCode

Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key

Select any OmniRoute model from the list

Solution: Configure your own OAuth credentials

npm:

Docker:

Solução: Configure suas próprias credenciais OAuth

Se usando npm:

Se usando Docker:

📊 Star History

Stargazers over time

🙏 Acknowledgments

Lizenz

119 KiB

Raw Blame History