OmniRoute/README.de.md
diegosouzapw d3ace8d611 fix: security hardening, tests, docs for Electron desktop & memory optimization
## Security Fixes
- Sanitize OMNIROUTE_MEMORY_MB with parseInt + range validation (64-16384)
  to prevent command injection via spawn() args
- Validate URL protocol in shell.openExternal (http/https only)
  to prevent RCE in Electron renderer compromise
- Bump default memory from 256MB to 512MB

## Electron package-lock.json
- Added to .gitignore (5278 lines removed from tracking)

## Test Suite (64 tests, 9 suites)
- electron-main.test.mjs: URL validation, IPC channels, window handler
- electron-preload.test.mjs: channel whitelist, API surface, open-external
- cli-memory.test.mjs: injection prevention, boundary values, .env parsing

## Documentation
- Desktop App section added to all 30 READMEs (9 fully translated)
- USER_GUIDE.md updated with 512MB default
- .env.example reflects new defaults
2026-02-28 07:59:38 -03:00

37 KiB
Raw Blame History

OmniRoute Dashboard

🚀 OmniRoute — Das kostenlose AI-Gateway

Höre nie auf zu programmieren. Intelligentes Routing zu KOSTENLOSEN und günstigen KI-Modellen mit automatischem Fallback.

Dein universeller API-Proxy — ein Endpoint, 36+ Anbieter, null Ausfallzeit.

Chat Completions • Embeddings • Bildgenerierung • Audio • Reranking • 100% TypeScript


🤖 Kostenloser KI-Anbieter für deine Lieblings-Coding-Agenten

Verbinde jedes KI-gesteuerte IDE- oder CLI-Tool über OmniRoute — kostenloses API-Gateway für unbegrenztes Programmieren.

OpenClaw
OpenClaw

205K
NanoBot
NanoBot

20.9K
PicoClaw
PicoClaw

14.6K
ZeroClaw
ZeroClaw

9.9K
IronClaw
IronClaw

2.1K
OpenCode
OpenCode

106K
Codex CLI
Codex CLI

60.8K
Claude Code
Claude Code

67.3K
Gemini CLI
Gemini CLI

94.7K
Kilo Code
Kilo Code

15.5K

📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 — eine Konfiguration, unbegrenzte Modelle und Kontingent


npm version Docker Hub License Website WhatsApp

🌐 Website🚀 Schnellstart💡 Funktionen📖 Doku💰 Preise

🌐 Verfügbar in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino


🤔 Warum OmniRoute?

Hör auf, Geld zu verschwenden und an Limits zu stoßen:

  • Abo-Kontingent verfällt jeden Monat ungenutzt
  • Rate-Limits stoppen dich mitten beim Programmieren
  • Teure APIs ($20-50/Monat pro Anbieter)
  • Manuelles Wechseln zwischen Anbietern

OmniRoute löst das:

  • Abos maximieren — Kontingente tracken, alles vor dem Reset nutzen
  • Automatischer Fallback — Abo → API Key → Günstig → Kostenlos, null Ausfallzeit
  • Multi-Account — Round-Robin zwischen Konten pro Anbieter
  • Universal — Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, jedem CLI-Tool

🔄 So funktioniert's

┌─────────────┐
│  Dein CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│         OmniRoute (Smart Router)         │
│  • Format-Übersetzung (OpenAI ↔ Claude) │
│  • Kontingent-Tracking + Embeddings + Bilder │
│  • Automatische Token-Erneuerung        │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: ABO] Claude Code, Codex, Gemini CLI
       │   ↓ Kontingent erschöpft
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM usw.
       │   ↓ Budget-Limit
       ├─→ [Tier 3: GÜNSTIG] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ Budget-Limit
       └─→ [Tier 4: KOSTENLOS] iFlow, Qwen, Kiro (unbegrenzt)

Ergebnis: Nie aufhören zu programmieren, minimale Kosten

Schnellstart

1. Global installieren:

npm install -g omniroute
omniroute

🎉 Das Dashboard öffnet sich unter http://localhost:20128

Befehl Beschreibung
omniroute Server starten (Standardport 20128)
omniroute --port 3000 Benutzerdefinierten Port verwenden
omniroute --no-open Browser nicht automatisch öffnen
omniroute --help Hilfe anzeigen

2. KOSTENLOSEN Anbieter verbinden:

Dashboard → Anbieter → Claude Code oder Antigravity verbinden → OAuth Login → Fertig!

3. In deinem CLI-Tool verwenden:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Einstellungen:
  Endpoint: http://localhost:20128/v1
  API Key: [vom Dashboard kopieren]
  Model: if/kimi-k2-thinking

Das war's! Beginne mit KOSTENLOSEN KI-Modellen zu programmieren.

Alternative — aus Quellcode ausführen:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute ist als öffentliches Docker-Image auf Docker Hub verfügbar.

Schnellstart:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Umgebungsdatei:

# .env kopieren und bearbeiten
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Docker Compose:

# Basisprofil (ohne CLI-Tools)
docker compose --profile base up -d

# CLI-Profil (Claude Code, Codex, OpenClaw integriert)
docker compose --profile cli up -d
Image Tag Größe Beschreibung
diegosouzapw/omniroute latest ~250MB Letztes stabiles Release
diegosouzapw/omniroute 1.0.6 ~250MB Aktuelle Version


🖥️ Desktop-App — Offline & Immer Aktiv

🆕 NEU! OmniRoute ist jetzt als native Desktop-Anwendung für Windows, macOS und Linux verfügbar.

  • 🖥️ Natives Fenster — Dediziertes App-Fenster mit System-Tray-Integration
  • 🔄 Autostart — OmniRoute beim Systemstart starten
  • 🔔 Native Benachrichtigungen — Warnungen bei Kontingent-Erschöpfung
  • Ein-Klick-Installation — NSIS (Windows), DMG (macOS), AppImage (Linux)
  • 🌐 Offline-Modus — Funktioniert vollständig offline mit integriertem Server
npm run electron:dev           # Entwicklungsmodus
npm run electron:build         # Aktuelle Plattform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg)
npm run electron:build:linux   # Linux (.AppImage)

📖 Vollständige Dokumentation: electron/README.md


💰 Preisübersicht

Tier Anbieter Kosten Kontingent-Reset Am besten für
💳 ABO Claude Code (Pro) $20/Monat 5h + wöchentlich Bereits abonniert
Codex (Plus/Pro) $20-200/Monat 5h + wöchentlich OpenAI-Nutzer
Gemini CLI KOSTENLOS 180K/Monat + 1K/Tag Alle!
GitHub Copilot $10-19/Monat Monatlich GitHub-Nutzer
🔑 API KEY NVIDIA NIM KOSTENLOS (1000 Credits) Einmalig Kostenloses Testen
DeepSeek Nach Verbrauch Keiner Bestes Preis-Leistung
Groq Gratis-Stufe + bezahlt Begrenzt Ultra-schnelle Inferenz
xAI (Grok) Nach Verbrauch Keiner Grok-Modelle
Mistral Gratis-Stufe + bezahlt Begrenzt Europäische KI
OpenRouter Nach Verbrauch Keiner 100+ Modelle
💰 GÜNSTIG GLM-4.7 $0.6/1M Täglich 10h Budget-Backup
MiniMax M2.1 $0.2/1M 5h rotierend Günstigste Option
Kimi K2 $9/Monat fest 10M Token/Monat Vorhersagbare Kosten
🆓 KOSTENLOS iFlow $0 Unbegrenzt 8 kostenlose Modelle
Qwen $0 Unbegrenzt 3 kostenlose Modelle
Kiro $0 Unbegrenzt Kostenloses Claude

💡 Profi-Tipp: Starte mit Gemini CLI (180K gratis/Monat) + iFlow (unbegrenzt gratis) = $0 Kosten!


🎯 Anwendungsfälle

Fall 1: „Ich habe ein Claude Pro Abo"

Problem: Kontingent verfällt ungenutzt, Rate-Limits während intensivem Programmieren

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (Abo voll ausnutzen)
  2. glm/glm-4.7               (günstiges Backup bei erschöpftem Kontingent)
  3. if/kimi-k2-thinking       (kostenloser Notfall-Fallback)

Monatliche Kosten: $20 (Abo) + ~$5 (Backup) = $25 gesamt
vs. $20 + an Limits stoßen = Frustration

Fall 2: „Ich will null Kosten"

Problem: Kann sich Abos nicht leisten, braucht zuverlässige KI zum Programmieren

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K gratis/Monat)
  2. if/kimi-k2-thinking       (unbegrenzt gratis)
  3. qw/qwen3-coder-plus       (unbegrenzt gratis)

Monatliche Kosten: $0
Qualität: Produktionsreife Modelle

Fall 3: „Ich muss 24/7 programmieren, ohne Unterbrechungen"

Problem: Enge Deadlines, kann sich keine Ausfallzeit leisten

Combo: "always-on"
  1. cc/claude-opus-4-6        (beste Qualität)
  2. cx/gpt-5.2-codex          (zweites Abo)
  3. glm/glm-4.7               (günstig, täglicher Reset)
  4. minimax/MiniMax-M2.1      (günstigste, 5h Reset)
  5. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Ergebnis: 5 Fallback-Ebenen = null Ausfallzeit

Fall 4: „Ich will KOSTENLOSE KI in OpenClaw"

Problem: Braucht KI-Assistenz in Messaging-Apps, komplett kostenlos

Combo: "openclaw-free"
  1. if/glm-4.7                (unbegrenzt kostenlos)
  2. if/minimax-m2.1           (unbegrenzt kostenlos)
  3. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Monatliche Kosten: $0
Zugang über: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

💡 Hauptfunktionen

🧠 Routing & Intelligenz

Funktion Was es macht
🎯 Intelligenter 4-Tier-Fallback Auto-Routing: Abo → API Key → Günstig → Kostenlos
📊 Echtzeit-Kontingent-Tracking Live Token-Zählung + Reset-Countdown pro Anbieter
🔄 Format-Übersetzung OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro nahtlos
👥 Multi-Account-Unterstützung Mehrere Konten pro Anbieter mit intelligenter Auswahl
🔄 Auto-Token-Erneuerung OAuth-Token werden automatisch mit Wiederholungen erneuert
🎨 Benutzerdefinierte Combos 6 Strategien: fill-first, round-robin, p2c, random, least-used, cost-optimized
🧩 Benutzerdefinierte Modelle Jede Modell-ID zu jedem Anbieter hinzufügen
🌐 Wildcard-Router provider/* Muster dynamisch an jeden Anbieter routen
🧠 Reasoning-Budget Passthrough, auto, custom und adaptive Modi für Reasoning-Modelle
💬 System Prompt Injection Globaler System Prompt für alle Anfragen
📄 API Responses Volle Unterstützung der OpenAI Responses API (/v1/responses) für Codex

🎵 Multi-Modale APIs

Funktion Was es macht
🖼️ Bildgenerierung /v1/images/generations — 4 Anbieter, 9+ Modelle
📐 Embeddings /v1/embeddings — 6 Anbieter, 9+ Modelle
🎤 Audio-Transkription /v1/audio/transcriptions — Whisper-kompatibel
🔊 Text-zu-Sprache /v1/audio/speech — Multi-Anbieter Audiosynthese
🛡️ Moderationen /v1/moderations — Sicherheitsüberprüfungen
🔀 Reranking /v1/rerank — Dokumenten-Relevanz-Neuordnung

🛡️ Resilienz & Sicherheit

Funktion Was es macht
🔌 Circuit Breaker Auto-Öffnung/-Schließung pro Anbieter mit konfigurierbaren Schwellen
🛡️ Anti-Thundering Herd Mutex + Semaphor Rate-Limit für API-Key-Anbieter
🧠 Semantischer Cache Zwei-Ebenen-Cache (Signatur + Semantik) senkt Kosten und Latenz
Anfrage-Idempotenz 5s Dedup-Fenster für doppelte Anfragen
🔒 TLS-Fingerprint-Spoofing Bot-Erkennung umgehen via wreq-js
🌐 IP-Filterung Allowlist/Blocklist für API-Zugriffskontrolle
📊 Editierbare Rate-Limits Konfigurierbare RPM, minimaler Abstand, max. Konkurrenz

📊 Observability & Analytics

Funktion Was es macht
📝 Anfrage-Logs Debug-Modus mit vollständigen Request/Response-Logs
💾 SQLite-Logs Persistente Proxy-Logs überleben Neustarts
📊 Analytics-Dashboard Recharts: Statistik-Karten, Nutzungsdiagramm, Anbieter-Tabelle
📈 Fortschritts-Tracking Opt-in SSE-Fortschrittsereignisse für Streaming
🧪 LLM-Evaluierungen Testen mit Golden Set und 4 Match-Strategien
🔍 Anfrage-Telemetrie p50/p95/p99 Latenz-Aggregation + X-Request-Id Tracking
📋 Logs + Kontingente Dedizierte Seiten für Log-Browsing und Kontingent-Tracking
🏥 Health Dashboard Uptime, Circuit-Breaker-Status, Lockouts, Cache-Statistiken
💰 Kosten-Tracking Budget-Management + Preiseinstellung pro Modell

☁️ Deployment & Sync

Funktion Was es macht
💾 Cloud Sync Einstellungen zwischen Geräten via Cloudflare Workers synchronisieren
🌐 Überall deployen Localhost, VPS, Docker, Cloudflare Workers
🔑 API-Key-Verwaltung API-Keys pro Anbieter generieren, rotieren und einschränken
🧙 Setup-Assistent 4-Schritte geführtes Setup für neue Nutzer
🔧 CLI Tools Dashboard Ein-Klick-Konfiguration für Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 DB-Backups Automatisches Backup und Wiederherstellung aller Einstellungen
📖 Funktionsdetails

🎯 Intelligenter 4-Tier-Fallback

Erstelle Combos mit automatischem Fallback:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (dein Abo)
  2. nvidia/llama-3.3-70b      (kostenlose NVIDIA API)
  3. glm/glm-4.7               (günstiges Backup, $0.6/1M)
  4. if/kimi-k2-thinking       (kostenloser Fallback)

→ Wechselt automatisch bei erschöpftem Kontingent oder Fehlern

📊 Echtzeit-Kontingent-Tracking

  • Token-Verbrauch pro Anbieter
  • Reset-Countdown (5 Stunden, täglich, wöchentlich)
  • Kostenabschätzung für bezahlte Stufen
  • Monatliche Ausgabenberichte

🔄 Format-Übersetzung

Nahtlose Übersetzung zwischen Formaten:

  • OpenAIClaudeGeminiOpenAI Responses
  • Dein CLI sendet OpenAI-Format → OmniRoute übersetzt → Anbieter empfängt natives Format
  • Funktioniert mit jedem Tool, das benutzerdefinierte OpenAI-Endpoints unterstützt

👥 Multi-Account-Unterstützung

  • Mehrere Konten pro Anbieter hinzufügen
  • Automatisches Round-Robin oder prioritätsbasiertes Routing
  • Fallback zum nächsten Konto bei Kontingent-Erschöpfung

🔄 Auto-Token-Erneuerung

  • OAuth-Token werden automatisch vor Ablauf erneuert
  • Keine manuelle Neuauthentifizierung nötig
  • Nahtlose Erfahrung über alle Anbieter

🎨 Benutzerdefinierte Combos

  • Unbegrenzte Modell-Kombinationen erstellen
  • 6 Strategien: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized
  • Combos zwischen Geräten mit Cloud Sync teilen

🏥 Health Dashboard

  • Systemstatus (Uptime, Version, Speichernutzung)
  • Circuit-Breaker-Status pro Anbieter (Closed/Open/Half-Open)
  • Rate-Limit-Status und aktive Lockouts
  • Signatur-Cache-Statistiken
  • Latenz-Telemetrie (p50/p95/p99) + Prompt-Cache
  • Gesundheitsstatus mit einem Klick zurücksetzen

🔧 Übersetzer-Playground

  • Debug, Test und Visualisierung von API-Format-Übersetzungen
  • Anfragen senden und sehen, wie OmniRoute zwischen Anbieter-Formaten übersetzt
  • Unschätzbar für Integrationsprobleme

💾 Cloud Sync

  • Anbieter, Combos und Einstellungen zwischen Geräten synchronisieren
  • Automatische Hintergrundsynchronisierung
  • Sichere verschlüsselte Speicherung

📖 Einrichtungsanleitung

💳 Abo-Anbieter

Claude Code (Pro/Max)

Dashboard → Anbieter → Claude Code verbinden
→ OAuth Login → Automatische Token-Erneuerung
→ 5h + wöchentliches Kontingent-Tracking

Modelle:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Profi-Tipp: Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute trackt Kontingent pro Modell!

OpenAI Codex (Plus/Pro)

Dashboard → Anbieter → Codex verbinden
→ OAuth Login (Port 1455)
→ 5h + wöchentlicher Reset

Modelle:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (KOSTENLOS 180K/Monat!)

Dashboard → Anbieter → Gemini CLI verbinden
→ Google OAuth
→ 180K Completions/Monat + 1K/Tag

Modelle:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Bester Wert: Riesiger Gratis-Tarif! Vor bezahlten Stufen nutzen.

GitHub Copilot

Dashboard → Anbieter → GitHub verbinden
→ OAuth via GitHub
→ Monatlicher Reset (1. des Monats)

Modelle:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro
🔑 API-Key-Anbieter

NVIDIA NIM (KOSTENLOS 1000 Credits!)

  1. Registrieren: build.nvidia.com
  2. Kostenlosen API-Key holen (1000 Inferenz-Credits inklusive)
  3. Dashboard → Anbieter hinzufügen → NVIDIA NIM:
    • API Key: nvapi-your-key

Modelle: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct und 50+ weitere

Profi-Tipp: OpenAI-kompatible API — funktioniert perfekt mit OmniRoutes Format-Übersetzung!

DeepSeek

  1. Registrieren: platform.deepseek.com
  2. API-Key holen
  3. Dashboard → Anbieter hinzufügen → DeepSeek

Modelle: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (Gratis-Stufe verfügbar!)

  1. Registrieren: console.groq.com
  2. API-Key holen (Gratis-Stufe inklusive)
  3. Dashboard → Anbieter hinzufügen → Groq

Modelle: groq/llama-3.3-70b, groq/mixtral-8x7b

Profi-Tipp: Ultra-schnelle Inferenz — am besten für Echtzeit-Programmierung!

OpenRouter (100+ Modelle)

  1. Registrieren: openrouter.ai
  2. API-Key holen
  3. Dashboard → Anbieter hinzufügen → OpenRouter

Modelle: Zugang zu 100+ Modellen aller großen Anbieter über einen einzigen API-Key.

💰 Günstige Anbieter (Backup)

GLM-4.7 (Täglicher Reset, $0.6/1M)

  1. Registrieren: Zhipu AI
  2. API-Key aus dem Coding Plan holen
  3. Dashboard → API Key hinzufügen:
    • Anbieter: glm
    • API Key: your-key

Nutze: glm/glm-4.7

Profi-Tipp: Der Coding Plan bietet 3× Kontingent zu 1/7 der Kosten! Täglicher Reset um 10:00.

MiniMax M2.1 (5h Reset, $0.20/1M)

  1. Registrieren: MiniMax
  2. API-Key holen
  3. Dashboard → API Key hinzufügen

Nutze: minimax/MiniMax-M2.1

Profi-Tipp: Günstigste Option für langen Kontext (1M Token)!

Kimi K2 ($9/Monat fest)

  1. Abonnieren: Moonshot AI
  2. API-Key holen
  3. Dashboard → API Key hinzufügen

Nutze: kimi/kimi-latest

Profi-Tipp: Feste $9/Monat für 10M Token = $0.90/1M effektive Kosten!

🆓 KOSTENLOSE Anbieter (Notfall-Backup)

iFlow (8 KOSTENLOSE Modelle)

Dashboard → iFlow verbinden
→ iFlow OAuth Login
→ Unbegrenzte Nutzung

Modelle:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 KOSTENLOSE Modelle)

Dashboard → Qwen verbinden
→ Geräte-Code-Autorisierung
→ Unbegrenzte Nutzung

Modelle:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Kostenloses Claude)

Dashboard → Kiro verbinden
→ AWS Builder ID oder Google/GitHub
→ Unbegrenzte Nutzung

Modelle:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5
🎨 Combos erstellen

Beispiel 1: Abo maximieren → Günstiges Backup

Dashboard → Combos → Neues erstellen

Name: premium-coding
Modelle:
  1. cc/claude-opus-4-6 (Primäres Abo)
  2. glm/glm-4.7 (Günstiges Backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Günstigster Fallback, $0.20/1M)

Im CLI nutzen: premium-coding

Beispiel 2: Nur Kostenlos (Null Kosten)

Name: free-combo
Modelle:
  1. gc/gemini-3-flash-preview (180K gratis/Monat)
  2. if/kimi-k2-thinking (unbegrenzt)
  3. qw/qwen3-coder-plus (unbegrenzt)

Kosten: Für immer $0!
🔧 CLI-Integration

Cursor IDE

Einstellungen → Modelle → Erweitert:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [aus OmniRoute Dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Nutze die CLI Tools Seite im Dashboard für Ein-Klick-Konfiguration, oder bearbeite ~/.claude/settings.json manuell.

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

OpenClaw

Option 1 — Dashboard (empfohlen):

Dashboard → CLI Tools → OpenClaw → Modell wählen → Anwenden

Option 2 — Manuell: ~/.openclaw/openclaw.json bearbeiten:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Hinweis: OpenClaw funktioniert nur mit lokalem OmniRoute. Verwende 127.0.0.1 statt localhost um IPv6-Auflösungsprobleme zu vermeiden.

Cline / Continue / RooCode

Einstellungen → API-Konfiguration:
  Anbieter: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [aus OmniRoute Dashboard]
  Model: if/kimi-k2-thinking

📊 Verfügbare Modelle

Alle verfügbaren Modelle anzeigen

Claude Code (cc/) - Pro/Max:

  • cc/claude-opus-4-6
  • cc/claude-sonnet-4-5-20250929
  • cc/claude-haiku-4-5-20251001

Codex (cx/) - Plus/Pro:

  • cx/gpt-5.2-codex
  • cx/gpt-5.1-codex-max

Gemini CLI (gc/) - KOSTENLOS:

  • gc/gemini-3-flash-preview
  • gc/gemini-2.5-pro

GitHub Copilot (gh/):

  • gh/gpt-5
  • gh/claude-4.5-sonnet

NVIDIA NIM (nvidia/) - KOSTENLOSE Credits:

  • nvidia/llama-3.3-70b-instruct
  • nvidia/mistral-7b-instruct
  • 50+ weitere Modelle auf build.nvidia.com

GLM (glm/) - $0.6/1M:

  • glm/glm-4.7

MiniMax (minimax/) - $0.2/1M:

  • minimax/MiniMax-M2.1

iFlow (if/) - KOSTENLOS:

  • if/kimi-k2-thinking
  • if/qwen3-coder-plus
  • if/deepseek-r1
  • if/glm-4.7
  • if/minimax-m2

Qwen (qw/) - KOSTENLOS:

  • qw/qwen3-coder-plus
  • qw/qwen3-coder-flash

Kiro (kr/) - KOSTENLOS:

  • kr/claude-sonnet-4.5
  • kr/claude-haiku-4.5

OpenRouter (or/) - 100+ Modelle:


🧪 Evaluierungen (Evals)

OmniRoute enthält ein integriertes Evaluierungs-Framework zum Testen der LLM-Antwortqualität gegen ein Golden Set. Zugang über Analytics → Evals im Dashboard.

Integriertes Golden Set

Das vorgeladene „OmniRoute Golden Set" enthält 10 Testfälle:

  • Begrüßungen, Mathematik, Geographie, Code-Generierung
  • JSON-Formatkonformität, Übersetzung, Markdown
  • Sicherheitsablehnung (schädlicher Inhalt), Zählung, Boolesche Logik

Evaluierungsstrategien

Strategie Beschreibung Beispiel
exact Ausgabe muss exakt übereinstimmen "4"
contains Ausgabe muss Teilzeichenfolge enthalten (case-insensitive) "Paris"
regex Ausgabe muss Regex-Muster entsprechen "1.*2.*3"
custom Benutzerdefinierte JS-Funktion gibt true/false zurück (output) => output.length > 10

🐛 Fehlerbehebung

Klicke zum Erweitern der Fehlerbehebungsanleitung

„Language model did not provide messages"

  • Anbieter-Kontingent erschöpft → Kontingent-Tracker im Dashboard prüfen
  • Lösung: Combo mit Fallback nutzen oder zu günstigerer Stufe wechseln

Rate Limiting

  • Abo-Kontingent erschöpft → Fallback zu GLM/MiniMax
  • Combo hinzufügen: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

OAuth-Token abgelaufen

  • Wird automatisch von OmniRoute erneuert
  • Falls Problem bestehen bleibt: Dashboard → Anbieter → Neu verbinden

Hohe Kosten

  • Nutzungsstatistiken unter Dashboard → Kosten prüfen
  • Primärmodell auf GLM/MiniMax umstellen
  • Gratis-Stufe (Gemini CLI, iFlow) für unkritische Aufgaben nutzen

Dashboard öffnet sich auf falschem Port

  • PORT=20128 und NEXT_PUBLIC_BASE_URL=http://localhost:20128 setzen

Cloud-Sync-Fehler

  • Prüfe dass BASE_URL auf deine laufende Instanz zeigt
  • Prüfe dass CLOUD_URL auf den erwarteten Cloud-Endpoint zeigt
  • NEXT_PUBLIC_* Werte mit Serverwerten synchron halten

Erster Login funktioniert nicht

  • INITIAL_PASSWORD in .env prüfen
  • Falls nicht gesetzt, Standard-Passwort ist 123456

Keine Anfrage-Logs

  • ENABLE_REQUEST_LOGS=true in .env setzen

Verbindungstest zeigt „Invalid" für OpenAI-kompatible Anbieter

  • Viele Anbieter stellen den /models Endpoint nicht bereit
  • OmniRoute v1.0.6+ enthält Fallback-Validierung via Chat Completions
  • Stelle sicher, dass die Base URL den /v1 Suffix enthält

🛠️ Technologie-Stack

  • Runtime: Node.js 20+
  • Sprache: TypeScript 5.9 — 100% TypeScript in src/ und open-sse/ (v1.0.6)
  • Framework: Next.js 16 + React 19 + Tailwind CSS 4
  • Datenbank: LowDB (JSON) + SQLite (Domain-Status + Proxy-Logs)
  • Streaming: Server-Sent Events (SSE)
  • Auth: OAuth 2.0 (PKCE) + JWT + API Keys
  • Testing: Node.js Test Runner (368+ Unit-Tests)
  • CI/CD: GitHub Actions (automatische npm + Docker Hub Veröffentlichung bei Release)
  • Website: omniroute.online
  • Paket: npmjs.com/package/omniroute
  • Docker: hub.docker.com/r/diegosouzapw/omniroute
  • Resilienz: Circuit Breaker, exponentieller Backoff, Anti-Thundering Herd, TLS-Spoofing

📖 Dokumentation

Dokument Beschreibung
Benutzerhandbuch Anbieter, Combos, CLI-Integration, Deploy
API-Referenz Alle Endpoints mit Beispielen
Fehlerbehebung Häufige Probleme und Lösungen
Architektur Systemarchitektur und Interna
Mitwirken Entwicklungs-Setup und Richtlinien
OpenAPI-Spezifikation OpenAPI 3.0 Spezifikation
Sicherheitsrichtlinie Schwachstellen melden und Sicherheitspraktiken

📧 Support

💬 Treten Sie unserer Community bei! WhatsApp-Gruppe — Hilfe bekommen, Tipps teilen und auf dem Laufenden bleiben.


👥 Mitwirkende

Contributors

Wie du mitwirken kannst

  1. Repository forken
  2. Feature-Branch erstellen (git checkout -b feature/amazing-feature)
  3. Änderungen committen (git commit -m 'Add amazing feature')
  4. Branch pushen (git push origin feature/amazing-feature)
  5. Pull Request öffnen

Siehe CONTRIBUTING.md für detaillierte Richtlinien.

Neue Version veröffentlichen

# Release erstellen — npm-Veröffentlichung erfolgt automatisch
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 Star-Verlauf

Star History Chart

🙏 Danksagungen

Besonderer Dank an 9router von decolua — das Originalprojekt, das diesen Fork inspiriert hat. OmniRoute baut auf diesem unglaublichen Fundament auf mit zusätzlichen Funktionen, Multi-Modalen APIs und einem vollständigen TypeScript-Rewrite.

Besonderer Dank an CLIProxyAPI — die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat.


📄 Lizenz

MIT-Lizenz — siehe LICENSE für Details.


Mit ❤️ gemacht für Entwickler, die 24/7 programmieren
omniroute.online