Add complete Bulgarian (bg) localization of the troubleshooting guide, covering provider issues, cloud sync, Docker, CLI tools, routing, environment variables, and debugging instructions.
31 KiB
Guide de l'utilisateur
🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Guide complet pour configurer les fournisseurs, créer des combos, intégrer des outils CLI et déployer OmniRoute.
Table des matières
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
💰 Aperçu des prix
| Niveau | Fournisseur | Coût | Réinitialisation des quotas | Idéal pour |
|---|---|---|---|---|
| 💳 ABONNEMENT | Claude Code (Pro) | 20 $/mois | 5h + hebdomadaire | Déjà abonné |
| Codex (Plus/Pro) | 20-200 $/mois | 5h + hebdomadaire | Utilisateurs d'OpenAI | |
| CLI Gémeaux | GRATUIT | 180K/mois + 1K/jour | Tout le monde! | |
| Copilote GitHub | 10-19 $/mois | Mensuel | Utilisateurs GitHub | |
| 🔑 CLÉ API | Recherche profonde | Paiement à l'utilisation | Aucun | Raisonnement bon marché |
| Groq | Paiement à l'utilisation | Aucun | Inférence ultra-rapide | |
| xAI (Grok) | Paiement à l'utilisation | Aucun | Raisonnement Grok 4 | |
| Mistral | Paiement à l'utilisation | Aucun | Modèles hébergés dans l'UE | |
| Perplexité | Paiement à l'utilisation | Aucun | Recherche augmentée | |
| Ensemble IA | Paiement à l'utilisation | Aucun | Modèles open source | |
| IA de feux d'artifice | Paiement à l'utilisation | Aucun | Images FLUX rapides | |
| Cérébraux | Paiement à l'utilisation | Aucun | Vitesse à l'échelle d'une tranche | |
| Cohérer | Paiement à l'utilisation | Aucun | Commande R+ RAG | |
| NIM NVIDIA | Paiement à l'utilisation | Aucun | Modèles d'entreprise | |
| 💰 BON MARCHÉ | GLM-4.7 | 0,6 $/1 M | Tous les jours 10h | Sauvegarde budgétaire |
| MiniMax M2.1 | 0,2 $/1 M | 5 heures roulantes | Option la moins chère | |
| Kimi K2 | 9 $/mois plat | 10 millions de jetons/mois | Coût prévisible | |
| 🆓 GRATUIT | iFlow | 0 $ | Illimité | 8 modèles gratuits |
| Qwen | 0 $ | Illimité | 3 modèles gratuits | |
| Kiro | 0 $ | Illimité | Claude gratuit |
💡 Conseil de pro : Commencez avec Gemini CLI (180 000 gratuits/mois) + combo iFlow (gratuit et illimité) = 0 $ de coût !
🎯 Cas d'utilisation
Cas 1 : "J'ai un abonnement Claude Pro"
Problème : Le quota expire sans être utilisé, limites de débit lors d'un codage intensif
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Cas 2 : "Je veux un coût nul"
Problème : Je ne peux pas payer les abonnements, j'ai besoin d'un codage IA fiable
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Cas 3 : "J'ai besoin de coder 24h/24 et 7j/7, sans interruption"
Problème : Délais, je ne peux pas me permettre de temps d'arrêt
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
Cas 4 : "Je veux une IA GRATUITE dans OpenClaw"
Problème : Besoin d'un assistant IA dans les applications de messagerie, entièrement gratuit
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
📖 Configuration du fournisseur
🔐 Fournisseurs d'abonnements
Claude Code (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001
Conseil de pro : Utilisez Opus pour les tâches complexes, Sonnet pour la rapidité. OmniRoute suit le quota par modèle !
Codex OpenAI (Plus/Pro)
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-max
Gemini CLI (180 000 GRATUITS/mois !)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-pro
Meilleur rapport qualité-prix : Énorme niveau gratuit ! Utilisez-le avant les niveaux payants.
Copilote GitHub
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro
💰 Fournisseurs bon marché
GLM-4.7 (réinitialisation quotidienne, 0,6 $/1 million)
- Inscrivez-vous : Zhipu AI
- Obtenez la clé API du plan de codage
- Tableau de bord → Ajouter une clé API : Fournisseur :
glm, Clé API :your-key
Utilisez : glm/glm-4.7 — Conseil de pro : Le plan de codage offre un quota de 3 × à un coût de 1/7 ! Réinitialisation quotidienne à 10h00.
MiniMax M2.1 (réinitialisation de 5 h, 0,20 $/1 M)
- Inscrivez-vous : MiniMax
- Obtenir la clé API → Tableau de bord → Ajouter une clé API
Utilisez : minimax/MiniMax-M2.1 — Conseil de pro : Option la moins chère pour un contexte long (1 million de jetons) !
Kimi K2 (9$/mois fixe)
- Abonnez-vous : Moonshot AI
- Obtenir la clé API → Tableau de bord → Ajouter une clé API
Utilisez : kimi/kimi-latest — Conseil de pro : Fixe 9 $/mois pour 10 millions de jetons = 0,90 $/1 million de coût effectif !
🆓 Fournisseurs GRATUITS
iFlow (8 modèles GRATUITS)
Dashboard → Connect iFlow → OAuth login → Unlimited usage
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1
Qwen (3 modèles GRATUITS)
Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash
Kiro (Claude GRATUIT)
Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
🎨Combinaisons
Exemple 1 : Maximiser l'abonnement → Sauvegarde bon marché
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Exemple 2 : Gratuit uniquement (sans coût)
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 Intégration CLI
IDE de curseur
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from omniroute dashboard]
Model: cc/claude-opus-4-6
###Claude Code
Modifier ~/.claude/config.json :
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-omniroute-api-key"
}
CLI du Codex
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"
OpenClaw
Modifier ~/.openclaw/openclaw.json :
{
"agents": {
"defaults": {
"model": { "primary": "omniroute/if/glm-4.7" }
}
},
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://localhost:20128/v1",
"apiKey": "your-omniroute-api-key",
"api": "openai-completions",
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
}
}
}
}
Ou utilisez le tableau de bord : Outils CLI → OpenClaw → Configuration automatique
Cline / Continuer / RooCode
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6
🚀 Déploiement
Déploiement VPS
git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
npm run start
# Or: pm2 start npm --name omniroute -- start
Docker
# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .
# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli
Pour le mode intégré à l'hôte avec les binaires CLI, consultez la section Docker dans la documentation principale.
Variables d'environnement
| Variables | Par défaut | Descriptif |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
Secret de signature JWT (changement de production) |
INITIAL_PASSWORD |
123456 |
Mot de passe de première connexion |
DATA_DIR |
~/.omniroute |
Répertoire de données (base de données, utilisation, journaux) |
PORT |
cadre par défaut | Port de service (20128 dans les exemples) |
HOSTNAME |
cadre par défaut | Lier l'hôte (Docker par défaut est 0.0.0.0) |
NODE_ENV |
valeur par défaut d'exécution | Définissez production pour le déploiement |
BASE_URL |
http://localhost:20128 |
URL de base interne côté serveur |
CLOUD_URL |
https://omniroute.dev |
URL de base du point de terminaison de synchronisation cloud |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
Secret HMAC pour les clés API générées |
REQUIRE_API_KEY |
false |
Appliquer la clé API Bearer sur /v1/* |
ENABLE_REQUEST_LOGS |
false |
Active les journaux de requêtes/réponses |
AUTH_COOKIE_SECURE |
false |
Forcer le cookie d'authentification Secure (derrière le proxy inverse HTTPS) |
Pour la référence complète des variables d'environnement, consultez le README.
📊 Modèles disponibles
Voir tous les modèles disponibles
Code Claude (cc/) — Pro/Max : cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001
Codex (cx/) — Plus/Pro : cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
Gemini CLI (gc/) — GRATUIT : gc/gemini-3-flash-preview, gc/gemini-2.5-pro
Copilote GitHub (gh/) : gh/gpt-5, gh/claude-4.5-sonnet
GLM (glm/) — 0,6 $/1 million : glm/glm-4.7
MiniMax (minimax/) — 0,2 $/1 million : minimax/MiniMax-M2.1
iFlow (if/) — GRATUIT : if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
Qwen (qw/) — GRATUIT : qw/qwen3-coder-plus, qw/qwen3-coder-flash
Kiro (kr/) — GRATUIT : kr/claude-sonnet-4.5, kr/claude-haiku-4.5
Recherche profonde (ds/) : ds/deepseek-chat, ds/deepseek-reasoner
Groq (groq/) : groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/) : xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
Mistral (mistral/) : mistral/mistral-large-2501, mistral/codestral-2501
Perplexité (pplx/) : pplx/sonar-pro, pplx/sonar
Ensemble IA (together/) : together/meta-llama/Llama-3.3-70B-Instruct-Turbo
IA de feux d'artifice (fireworks/) : fireworks/accounts/fireworks/models/deepseek-v3p1
Cérébras (cerebras/) : cerebras/llama-3.3-70b
Cohérer (cohere/) : cohere/command-r-plus-08-2024
NIM NVIDIA (nvidia/) : nvidia/nvidia/llama-3.3-70b-instruct
🧩 Fonctionnalités avancées
Modèles personnalisés
Ajoutez n'importe quel ID de modèle à n'importe quel fournisseur sans attendre une mise à jour de l'application :
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"
Ou utilisez le tableau de bord : Fournisseurs → [Fournisseur] → Modèles personnalisés.
Itinéraires de fournisseurs dédiés
Acheminez les demandes directement vers un fournisseur spécifique avec validation du modèle :
POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations
Le préfixe du fournisseur est ajouté automatiquement s'il est manquant. Les modèles incompatibles renvoient 400.
Configuration du proxy réseau
# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'
Précédence : Spécifique à la clé → Spécifique au combo → Spécifique au fournisseur → Global → Environnement.
API du catalogue de modèles
curl http://localhost:20128/api/models/catalog
Renvoie les modèles regroupés par fournisseur avec des types (chat, embedding, image).
Synchronisation avec le cloud
- Synchronisez les fournisseurs, les combos et les paramètres sur tous les appareils
- Synchronisation automatique en arrière-plan avec délai d'attente + échec rapide
- Préférer le côté serveur
BASE_URL/CLOUD_URLen production
LLM Gateway Intelligence (Phase 9)
- Cache sémantique — Met en cache automatiquement les réponses hors streaming, température = 0 (contourner avec
X-OmniRoute-No-Cache: true) - Demande d'idempotence — Déduplique les requêtes dans les 5 secondes via l'en-tête
Idempotency-KeyouX-Request-Id - Suivi des progrès – Événements SSE
event: progressopt-in via l'en-têteX-OmniRoute-Progress: true
Aire de jeux des traducteurs
Accès via Tableau de bord → Traducteur. Déboguez et visualisez comment OmniRoute traduit les requêtes API entre les fournisseurs.
| Mode | Objectif |
|---|---|
| Aire de jeux | Sélectionnez les formats source/cible, collez une requête et voyez instantanément le résultat traduit |
| Testeur de chat | Envoyez des messages de chat en direct via le proxy et inspectez le cycle complet de demande/réponse |
| Banc d'essai | Exécutez des tests par lots sur plusieurs combinaisons de formats pour vérifier l'exactitude de la traduction |
| Moniteur en direct | Regardez les traductions en temps réel à mesure que les demandes transitent par le proxy |
Cas d'utilisation :
- Déboguer pourquoi une combinaison client/fournisseur spécifique échoue
- Vérifiez que les balises de réflexion, les appels d'outils et les invites système se traduisent correctement
- Comparez les différences de format entre les formats API OpenAI, Claude, Gemini et Responses
Stratégies de routage
Configurez via Tableau de bord → Paramètres → Routage.
| Stratégie | Descriptif |
|---|---|
| Remplir en premier | Utilise les comptes par ordre de priorité : le compte principal gère toutes les demandes jusqu'à ce qu'il soit indisponible |
| Tournoi à la ronde | Parcourt tous les comptes avec une limite persistante configurable (par défaut : 3 appels par compte) |
| P2C (Puissance de deux choix) | Sélectionne 2 comptes aléatoires et oriente vers le compte le plus sain – équilibre la charge avec la conscience de la santé |
| Aléatoire | Sélectionne au hasard un compte pour chaque demande à l'aide de Fisher-Yates shuffle |
| Le moins utilisé | Routes vers le compte avec l'horodatage lastUsedAt le plus ancien, répartissant le trafic de manière uniforme |
| Coût optimisé | Itinéraires vers le compte avec la valeur de priorité la plus faible, optimisation pour les fournisseurs les moins chers |
Alias de modèles génériques
Créez des modèles génériques pour remapper les noms de modèles :
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-* → Target: gh/gpt-5.1-codex
Les caractères génériques prennent en charge * (n'importe quel caractère) et ? (un seul caractère).
Chaînes de secours
Définissez des chaînes de secours globales qui s'appliquent à toutes les requêtes :
Chain: production-fallback
1. cc/claude-opus-4-6
2. gh/gpt-5.1-codex
3. glm/glm-4.7
Résilience et disjoncteurs
Configurez via Tableau de bord → Paramètres → Résilience.
OmniRoute met en œuvre la résilience au niveau du fournisseur avec quatre composants :
-
Profils de fournisseur — Configuration par fournisseur pour :
- Seuil de défaillance (combien de défaillances avant ouverture)
- Durée du temps de recharge
- Sensibilité de détection de limite de débit
- Paramètres d'intervalle exponentiel
-
Limites de débit modifiables — Paramètres par défaut au niveau du système configurables dans le tableau de bord :
- Requêtes par minute (RPM) — Nombre maximal de requêtes par minute et par compte
- Min Time Between Requests — Écart minimum en millisecondes entre les requêtes
- Max Concurrent Requests — Nombre maximal de requêtes simultanées par compte
- Cliquez sur Modifier pour modifier, puis sur Enregistrer ou Annuler. Les valeurs persistent via l'API de résilience.
-
Disjoncteur — Suit les pannes par fournisseur et ouvre automatiquement le circuit lorsqu'un seuil est atteint :
- FERMÉ (sain) — Les demandes circulent normalement
- OPEN — Le fournisseur est temporairement bloqué après des échecs répétés
- HALF_OPEN — Test si le fournisseur a récupéré
-
Politiques et identifiants verrouillés — Affiche l'état du disjoncteur et les identifiants verrouillés avec capacité de déverrouillage forcé.
-
Détection automatique des limites de débit — Surveille les en-têtes
429etRetry-Afterpour éviter de manière proactive d'atteindre les limites de débit du fournisseur.
Conseil de pro : Utilisez le bouton Réinitialiser tout pour effacer tous les disjoncteurs et les temps de recharge lorsqu'un fournisseur se remet d'une panne.
Exportation/Importation de base de données
Gérez les sauvegardes de base de données dans Tableau de bord → Paramètres → Système et stockage.
| Actions | Descriptif |
|---|---|
| Exporter la base de données | Télécharge la base de données SQLite actuelle sous forme de fichier .sqlite |
| Exporter tout (.tar.gz) | Télécharge une archive de sauvegarde complète comprenant : base de données, paramètres, combos, connexions du fournisseur (pas d'informations d'identification), métadonnées de la clé API |
| Importer la base de données | Téléchargez un fichier .sqlite pour remplacer la base de données actuelle. Une sauvegarde de pré-importation est automatiquement créée |
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
-F "file=@backup.sqlite"
Validation de l'importation : Le fichier importé est validé pour son intégrité (vérification pragma SQLite), les tables requises (provider_connections, provider_nodes, combos, api_keys) et sa taille (max 100 Mo).
Cas d'utilisation :
- Migrer OmniRoute entre machines
- Créer des sauvegardes externes pour la reprise après sinistre
- Partager les configurations entre les membres de l'équipe (exporter tout → partager l'archive)
Tableau de bord des paramètres
La page des paramètres est organisée en 5 onglets pour une navigation facile :
| Onglet | Contenu |
|---|---|
| Sécurité | Paramètres de connexion/mot de passe, contrôle d'accès IP, authentification API pour /models et blocage du fournisseur |
| Routage | Stratégie de routage globale (6 options), alias de modèle générique, chaînes de secours, valeurs par défaut combinées |
| Résilience | Profils de fournisseurs, limites de débit modifiables, état du disjoncteur, politiques et identifiants verrouillés |
| IA | Configuration du budget de réflexion, injection d'invite du système global, statistiques de cache d'invite |
| Avancé | Configuration globale du proxy (HTTP/SOCKS5) |
Gestion des coûts et du budget
Accès via Tableau de bord → Coûts.
| Onglet | Objectif |
|---|---|
| Budget | Fixez des limites de dépenses par clé API avec des budgets quotidiens/hebdomadaires/mensuels et un suivi en temps réel |
| Tarif | Afficher et modifier les entrées de tarification du modèle — coût par 1 000 jetons d'entrée/sortie par fournisseur |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budget
Suivi des coûts : Chaque demande enregistre l'utilisation du jeton et calcule le coût à l'aide du tableau de tarification. Affichez les répartitions dans Tableau de bord → Utilisation par fournisseur, modèle et clé API.
Transcription audio
OmniRoute prend en charge la transcription audio via le point de terminaison compatible OpenAI :
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"
Fournisseurs disponibles : Deepgram (deepgram/), AssemblyAI (assemblyai/).
Formats audio pris en charge : mp3, wav, m4a, flac, ogg, webm.
Stratégies d'équilibrage des combos
Configurez l'équilibrage par combo dans Tableau de bord → Combos → Créer/Modifier → Stratégie.
| Stratégie | Descriptif |
|---|---|
| Robin à la ronde | Tourne à travers les modèles de manière séquentielle |
| Priorité | Essaie toujours le premier modèle ; se rabat uniquement sur l'erreur |
| Aléatoire | Sélectionne un modèle aléatoire dans le combo pour chaque demande |
| Pondéré | Itinéraires proportionnellement basés sur les poids attribués par modèle |
| Les moins utilisés | Itinéraires vers le modèle avec le moins de requêtes récentes (utilise des métriques combinées) |
| Coût optimisé | Itinéraires vers le modèle disponible le moins cher (utilise le tableau de prix) |
Les valeurs par défaut des combos globaux peuvent être définies dans Tableau de bord → Paramètres → Routage → Paramètres par défaut des combos.
Tableau de bord de santé
Accès via Tableau de bord → Santé. Aperçu de l'état du système en temps réel avec 6 cartes :
| Carte | Ce que cela montre |
|---|---|
| État du système | Disponibilité, version, utilisation de la mémoire, répertoire de données |
| Santé du fournisseur | État du disjoncteur par fournisseur (Fermé/Ouvert/Semi-ouvert) |
| Limites de taux | Temps de recharge de la limite de débit actif par compte avec temps restant |
| Verrouillages actifs | Fournisseurs temporairement bloqués par la politique de verrouillage |
| Cache de signatures | Statistiques du cache de déduplication (clés actives, taux de réussite) |
| Télémétrie de latence | Agrégation de latence p50/p95/p99 par fournisseur |
Conseil de pro : La page Santé s'actualise automatiquement toutes les 10 secondes. Utilisez la carte disjoncteur pour identifier les fournisseurs qui rencontrent des problèmes.