41 KiB
उपयोगकर्ता गाइड
🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
प्रदाताओं को कॉन्फ़िगर करने, कॉम्बो बनाने, सीएलआई टूल को एकीकृत करने और ओमनीरूट को तैनात करने के लिए संपूर्ण मार्गदर्शिका।
सामग्री तालिका
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
💰 मूल्य निर्धारण एक नज़र में
| टियर | प्रदाता | लागत | कोटा रीसेट | के लिए सर्वश्रेष्ठ |
|---|---|---|---|---|
| 💳 सदस्यता | क्लाउड कोड (प्रो) | $20/माह | 5 घंटे + साप्ताहिक | पहले ही सदस्यता ले ली है |
| कोडेक्स (प्लस/प्रो) | $20-200/महीना | 5 घंटे + साप्ताहिक | OpenAI उपयोगकर्ता | |
| जेमिनी सीएलआई | मुफ़्त | 180K/माह + 1K/दिन | सब लोग! | |
| गिटहब कोपायलट | $10-19/माह | मासिक | GitHub उपयोगकर्ता | |
| 🔑एपीआई कुंजी | डीपसीक | प्रति उपयोग भुगतान करें | कोई नहीं | सस्ता तर्क |
| ग्रोक | प्रति उपयोग भुगतान करें | कोई नहीं | अल्ट्रा-फास्ट अनुमान | |
| एक्सएआई (ग्रोक) | प्रति उपयोग भुगतान करें | कोई नहीं | ग्रोक 4 तर्क | |
| मिस्ट्रल | प्रति उपयोग भुगतान करें | कोई नहीं | ईयू द्वारा होस्ट किए गए मॉडल | |
| उलझन | प्रति उपयोग भुगतान करें | कोई नहीं | खोज-संवर्धित | |
| एक साथ एआई | प्रति उपयोग भुगतान करें | कोई नहीं | ओपन-सोर्स मॉडल | |
| आतिशबाजी एआई | प्रति उपयोग भुगतान करें | कोई नहीं | फास्ट फ्लक्स छवियां | |
| सेरेब्रस | प्रति उपयोग भुगतान करें | कोई नहीं | वेफर-स्केल गति | |
| सहभागी | प्रति उपयोग भुगतान करें | कोई नहीं | कमांड आर+आरएजी | |
| एनवीडिया एनआईएम | प्रति उपयोग भुगतान करें | कोई नहीं | एंटरप्राइज़ मॉडल | |
| 💰सस्ता | जीएलएम-4.7 | $0.6/1 मिलियन | प्रतिदिन सुबह 10 बजे | बजट बैकअप |
| मिनीमैक्स एम2.1 | $0.2/1 मिलियन | 5 घंटे की रोलिंग | सबसे सस्ता विकल्प | |
| किमी K2 | $9/महीना फ्लैट | 10एम टोकन/माह | अनुमानित लागत | |
| 🆓 मुफ़्त | आईफ्लो | $0 | असीमित | 8 मॉडल निःशुल्क |
| क्वेन | $0 | असीमित | 3 मॉडल मुफ़्त | |
| किरो | $0 | असीमित | क्लाउड मुक्त |
💡 प्रो टिप: जेमिनी सीएलआई (180 हजार निःशुल्क/माह) + आईफ्लो (असीमित निःशुल्क) कॉम्बो = $0 लागत से शुरू करें!
🎯 उपयोग के मामले
केस 1: "मेरे पास क्लाउड प्रो सदस्यता है"
समस्या: भारी कोडिंग के दौरान कोटा अप्रयुक्त, दर सीमा समाप्त हो जाता है
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
केस 2: "मुझे शून्य लागत चाहिए"
समस्या: सदस्यताएं वहन नहीं कर सकते, विश्वसनीय एआई कोडिंग की आवश्यकता है
केस 3: "मुझे 24/7 कोडिंग चाहिए, कोई रुकावट नहीं"
समस्या: समय सीमा, डाउनटाइम बर्दाश्त नहीं कर सकते
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
केस 4: "मुझे ओपनक्लॉ में मुफ़्त एआई चाहिए"
समस्या: मैसेजिंग ऐप्स में AI सहायक की आवश्यकता है, पूरी तरह से निःशुल्क
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
📖 प्रदाता सेटअप
🔐 सदस्यता प्रदाता
क्लाउड कोड (प्रो/मैक्स)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001
प्रो टिप: जटिल कार्यों के लिए ओपस और गति के लिए सॉनेट का उपयोग करें। ओमनीरूट प्रति मॉडल कोटा ट्रैक करता है!
ओपनएआई कोडेक्स (प्लस/प्रो)
जेमिनी सीएलआई (मुफ़्त 180K/माह!)
सर्वोत्तम मूल्य: विशाल निःशुल्क स्तर! सशुल्क स्तरों से पहले इसका उपयोग करें।
गिटहब कोपायलट
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro
💰 सस्ते प्रदाता
GLM-4.7 (दैनिक रीसेट, $0.6/1 मिलियन)
- साइन अप करें: Zhipu AI
- कोडिंग योजना से एपीआई कुंजी प्राप्त करें
- डैशबोर्ड → एपीआई कुंजी जोड़ें: प्रदाता:
glm, एपीआई कुंजी:your-key
उपयोग करें: glm/glm-4.7 - प्रो टिप: कोडिंग प्लान 1/7 लागत पर 3× कोटा प्रदान करता है! प्रतिदिन सुबह 10:00 बजे रीसेट करें।
मिनीमैक्स एम2.1 (5 घंटे रीसेट, $0.20/1 मिलियन)
- साइन अप करें: MiniMax
- एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें
उपयोग करें: minimax/MiniMax-M2.1 - प्रो टिप: लंबे संदर्भ के लिए सबसे सस्ता विकल्प (1M टोकन)!
किमी K2 ($9/माह फ्लैट)
- सदस्यता लें: Moonshot AI
- एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें
उपयोग करें: kimi/kimi-latest - प्रो टिप: 10M टोकन के लिए निश्चित $9/माह = $0.90/1M प्रभावी लागत!
🆓 निःशुल्क प्रदाता
आईफ्लो (8 मुफ़्त मॉडल)
क्वेन (3 मुफ़्त मॉडल)
Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash
किरो (क्लाउड फ्री)
Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
🎨कॉम्बोज़
उदाहरण 1: सदस्यता अधिकतम करें → सस्ता बैकअप
उदाहरण 2: केवल निःशुल्क (शून्य लागत)
🔧 सीएलआई एकीकरण
कर्सर आईडीई
क्लाउड कोड
संपादित करें ~/.claude/config.json:
कोडेक्स सीएलआई
ओपनक्लॉ
संपादित करें ~/.openclaw/openclaw.json:
या डैशबोर्ड का उपयोग करें: सीएलआई टूल्स → ओपनक्लॉ → ऑटो-कॉन्फ़िगरेशन
क्लाइन / जारी रखें / रूकोड
🚀 परिनियोजन
वीपीएस परिनियोजन
डॉकर
सीएलआई बायनेरिज़ के साथ होस्ट-एकीकृत मोड के लिए, मुख्य दस्तावेज़ में डॉकर अनुभाग देखें।
पर्यावरण चर
| परिवर्तनीय | डिफ़ॉल्ट | विवरण |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
JWT हस्ताक्षर रहस्य (उत्पादन में परिवर्तन) |
INITIAL_PASSWORD |
123456 |
पहला लॉगिन पासवर्ड |
DATA_DIR |
~/.omniroute |
डेटा निर्देशिका (डीबी, उपयोग, लॉग) |
PORT |
फ्रेमवर्क डिफ़ॉल्ट | सर्विस पोर्ट (उदाहरणों में 20128) |
HOSTNAME |
फ्रेमवर्क डिफ़ॉल्ट | बाइंड होस्ट (डॉकर डिफ़ॉल्ट रूप से 0.0.0.0) |
NODE_ENV |
रनटाइम डिफ़ॉल्ट | तैनाती के लिए production सेट करें |
BASE_URL |
http://localhost:20128 |
सर्वर-साइड आंतरिक आधार URL |
CLOUD_URL |
https://omniroute.dev |
क्लाउड सिंक एंडपॉइंट बेस यूआरएल |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
जेनरेट की गई एपीआई कुंजियों के लिए एचएमएसी रहस्य |
REQUIRE_API_KEY |
false |
/v1/* पर बियरर एपीआई कुंजी लागू करें |
ENABLE_REQUEST_LOGS |
false |
अनुरोध/प्रतिक्रिया लॉग सक्षम करता है |
AUTH_COOKIE_SECURE |
false |
फोर्स Secure ऑथ कुकी (HTTPS रिवर्स प्रॉक्सी के पीछे) |
संपूर्ण पर्यावरण चर संदर्भ के लिए, README देखें।
📊 उपलब्ध मॉडल
क्लाउड कोड (cc/) — प्रो/मैक्स: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001
कोडेक्स (cx/) — प्लस/प्रो: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
मिथुन सीएलआई (gc/) — मुफ़्त: gc/gemini-3-flash-preview, gc/gemini-2.5-pro
गिटहब कोपायलट (gh/): gh/gpt-5, gh/claude-4.5-sonnet
जीएलएम (glm/) — $0.6/1M: glm/glm-4.7
मिनीमैक्स (minimax/) — $0.2/1M: minimax/MiniMax-M2.1
iFlow (if/) — मुफ़्त: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
क्वेन (qw/) — मुफ़्त: qw/qwen3-coder-plus, qw/qwen3-coder-flash
किरो (kr/) — मुफ़्त: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
डीपसीक (ds/): ds/deepseek-chat, ds/deepseek-reasoner
ग्रोक (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
मिस्ट्रल (mistral/): mistral/mistral-large-2501, mistral/codestral-2501
व्याकुलता (pplx/): pplx/sonar-pro, pplx/sonar
एक साथ AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo
आतिशबाजी एआई (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1
सेरेब्रस (cerebras/): cerebras/llama-3.3-70b
यहां (cohere/): cohere/command-r-plus-08-2024
एनवीडिया एनआईएम (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct
🧩 उन्नत सुविधाएँ
कस्टम मॉडल
ऐप अपडेट की प्रतीक्षा किए बिना किसी भी प्रदाता से कोई भी मॉडल आईडी जोड़ें:
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"
या डैशबोर्ड का उपयोग करें: प्रदाता → [प्रदाता] → कस्टम मॉडल।
समर्पित प्रदाता मार्ग
मॉडल सत्यापन के साथ सीधे एक विशिष्ट प्रदाता को रूट अनुरोध:
गायब होने पर प्रदाता उपसर्ग स्वतः जुड़ जाता है। बेमेल मॉडल 400 लौटाते हैं।
नेटवर्क प्रॉक्सी कॉन्फ़िगरेशन
प्राथमिकता: कुंजी-विशिष्ट → कॉम्बो-विशिष्ट → प्रदाता-विशिष्ट → वैश्विक → पर्यावरण।
मॉडल कैटलॉग एपीआई
प्रदाता द्वारा प्रकारों (chat, embedding, image) के साथ समूहीकृत मॉडल लौटाता है।
क्लाउड सिंक
- सभी डिवाइसों में सिंक प्रदाता, कॉम्बो और सेटिंग्स
- टाइमआउट + फेल-फास्ट के साथ स्वचालित पृष्ठभूमि सिंक
- उत्पादन में सर्वर-साइड
BASE_URL/CLOUD_URLको प्राथमिकता दें
एलएलएम गेटवे इंटेलिजेंस (चरण 9)
- सिमेंटिक कैश - ऑटो-कैश नॉन-स्ट्रीमिंग, तापमान = 0 प्रतिक्रियाएँ (
X-OmniRoute-No-Cache: trueके साथ बायपास) - इडेम्पोटेंसी का अनुरोध करें -
Idempotency-KeyयाX-Request-Idहेडर के माध्यम से 5s के भीतर अनुरोधों को डीडुप्लिकेट करता है - प्रगति ट्रैकिंग -
X-OmniRoute-Progress: trueहेडर के माध्यम से SSEevent: progressइवेंट में ऑप्ट-इन करें
अनुवादक खेल का मैदान
डैशबोर्ड → अनुवादक के माध्यम से पहुंच। डीबग करें और कल्पना करें कि कैसे ओमनीरूट प्रदाताओं के बीच एपीआई अनुरोधों का अनुवाद करता है।
| मोड | उद्देश्य |
|---|---|
| खेल का मैदान | स्रोत/लक्ष्य प्रारूप चुनें, एक अनुरोध चिपकाएँ, और अनुवादित आउटपुट तुरंत देखें |
| चैट परीक्षक | प्रॉक्सी के माध्यम से लाइव चैट संदेश भेजें और पूर्ण अनुरोध/प्रतिक्रिया चक्र का निरीक्षण करें |
| टेस्ट बेंच | अनुवाद की शुद्धता को सत्यापित करने के लिए कई प्रारूप संयोजनों में बैच परीक्षण चलाएँ |
| लाइव मॉनिटर | प्रॉक्सी के माध्यम से अनुरोध प्रवाहित होने पर वास्तविक समय में अनुवाद देखें |
उपयोग के मामले:
- डीबग करें कि कोई विशिष्ट ग्राहक/प्रदाता संयोजन विफल क्यों होता है
- सत्यापित करें कि थिंकिंग टैग, टूल कॉल और सिस्टम प्रॉम्प्ट सही ढंग से अनुवाद करते हैं
- ओपनएआई, क्लाउड, जेमिनी और रिस्पॉन्स एपीआई प्रारूपों के बीच प्रारूप अंतर की तुलना करें
रूटिंग रणनीतियाँ
डैशबोर्ड → सेटिंग्स → रूटिंग के माध्यम से कॉन्फ़िगर करें।
| रणनीति | विवरण | |
|---|---|---|
| पहले भरें | प्राथमिकता क्रम में खातों का उपयोग करता है - प्राथमिक खाता अनुपलब्ध होने तक सभी अनुरोधों को संभालता है | |
| राउंड रॉबिन | एक विन्यास योग्य चिपचिपा सीमा के साथ सभी खातों के माध्यम से चक्र (डिफ़ॉल्ट: प्रति खाता 3 कॉल) | |
| पी2सी (दो विकल्पों की शक्ति) | 2 यादृच्छिक खाते चुनता है और स्वस्थ खाते की ओर ले जाता है - स्वास्थ्य के प्रति जागरूकता के साथ भार संतुलित करता है | |
| यादृच्छिक | फिशर-येट्स शफल | का उपयोग करके प्रत्येक अनुरोध के लिए यादृच्छिक रूप से एक खाता चुनता है |
| कम से कम इस्तेमाल | सबसे पुराने lastUsedAt टाइमस्टैम्प के साथ खाते तक रूट, ट्रैफ़िक को समान रूप से वितरित करना |
|
| लागत अनुकूलित | सबसे कम लागत वाले प्रदाताओं के लिए अनुकूलन, सबसे कम प्राथमिकता मूल्य वाले खाते तक रूट |
वाइल्डकार्ड मॉडल उपनाम
मॉडल नामों को रीमैप करने के लिए वाइल्डकार्ड पैटर्न बनाएं:
वाइल्डकार्ड * (कोई भी वर्ण) और ? (एकल वर्ण) का समर्थन करते हैं।
फ़ॉलबैक चेन
वैश्विक फ़ॉलबैक श्रृंखलाओं को परिभाषित करें जो सभी अनुरोधों पर लागू होती हैं:
लचीलापन और सर्किट ब्रेकर
डैशबोर्ड → सेटिंग्स → लचीलापन के माध्यम से कॉन्फ़िगर करें।
ओमनीरूट चार घटकों के साथ प्रदाता-स्तरीय लचीलापन लागू करता है:
-
प्रदाता प्रोफाइल - प्रति-प्रदाता कॉन्फ़िगरेशन:
- विफलता सीमा (उद्घाटन से पहले कितनी विफलताएं)
- कूलडाउन अवधि
- दर सीमा का पता लगाने की संवेदनशीलता
- घातीय बैकऑफ़ पैरामीटर
-
संपादन योग्य दर सीमाएँ — डैशबोर्ड में कॉन्फ़िगर करने योग्य सिस्टम-स्तरीय डिफ़ॉल्ट:
- प्रति मिनट अनुरोध (आरपीएम) - प्रति खाता प्रति मिनट अधिकतम अनुरोध
- अनुरोधों के बीच न्यूनतम समय - अनुरोधों के बीच मिलीसेकंड में न्यूनतम अंतर
- अधिकतम समवर्ती अनुरोध — प्रति खाता अधिकतम एक साथ अनुरोध
- संशोधित करने के लिए संपादित करें पर क्लिक करें, फिर सहेजें या रद्द करें पर क्लिक करें। मान लचीलापन एपीआई के माध्यम से बने रहते हैं।
-
सर्किट ब्रेकर - प्रति प्रदाता विफलताओं को ट्रैक करता है और सीमा तक पहुंचने पर स्वचालित रूप से सर्किट खोलता है:
- बंद (स्वस्थ) - अनुरोध सामान्य रूप से प्रवाहित होते हैं
- खुला - बार-बार विफलताओं के बाद प्रदाता अस्थायी रूप से अवरुद्ध हो जाता है
- आधा_खुला — परीक्षण किया जा रहा है कि प्रदाता ठीक हो गया है या नहीं
-
नीतियाँ और लॉक किए गए पहचानकर्ता - बल-अनलॉक क्षमता के साथ सर्किट ब्रेकर की स्थिति और लॉक किए गए पहचानकर्ताओं को दिखाता है।
-
दर सीमा ऑटो-डिटेक्शन - प्रदाता दर सीमा से बचने के लिए
429औरRetry-Afterहेडर मॉनिटर करता है।
प्रो टिप: जब कोई प्रदाता आउटेज से उबरता है तो सभी सर्किट ब्रेकर और कूलडाउन को साफ़ करने के लिए रीसेट ऑल बटन का उपयोग करें।
डेटाबेस निर्यात/आयात
डैशबोर्ड → सेटिंग्स → सिस्टम और स्टोरेज में डेटाबेस बैकअप प्रबंधित करें।
| कार्रवाई | विवरण |
|---|---|
| डेटाबेस निर्यात करें | वर्तमान SQLite डेटाबेस को .sqlite फ़ाइल के रूप में डाउनलोड करता है |
| सभी निर्यात करें (.tar.gz) | एक पूर्ण बैकअप संग्रह डाउनलोड करता है जिसमें शामिल हैं: डेटाबेस, सेटिंग्स, कॉम्बो, प्रदाता कनेक्शन (कोई क्रेडेंशियल नहीं), एपीआई कुंजी मेटाडेटा |
| डेटाबेस आयात करें | वर्तमान डेटाबेस को बदलने के लिए .sqlite फ़ाइल अपलोड करें। एक पूर्व-आयात बैकअप स्वचालित रूप से बनाया जाता है |
आयात सत्यापन: आयातित फ़ाइल को अखंडता (SQLite प्राग्मा चेक), आवश्यक तालिकाओं (provider_connections, provider_nodes, combos, api_keys), और आकार (अधिकतम 100MB) के लिए मान्य किया गया है।
उपयोग के मामले:
- मशीनों के बीच ओम्निरूट माइग्रेट करें
- आपदा पुनर्प्राप्ति के लिए बाहरी बैकअप बनाएं
- टीम के सदस्यों के बीच कॉन्फ़िगरेशन साझा करें (सभी निर्यात करें → संग्रह साझा करें)
सेटिंग्स डैशबोर्ड
आसान नेविगेशन के लिए सेटिंग पृष्ठ को 5 टैब में व्यवस्थित किया गया है:
| टैब | सामग्री |
|---|---|
| सुरक्षा | लॉगिन/पासवर्ड सेटिंग्स, आईपी एक्सेस कंट्रोल, /models के लिए एपीआई प्रमाणीकरण, और प्रदाता ब्लॉकिंग |
| रूटिंग | वैश्विक रूटिंग रणनीति (6 विकल्प), वाइल्डकार्ड मॉडल उपनाम, फ़ॉलबैक चेन, कॉम्बो डिफ़ॉल्ट |
| लचीलापन | प्रदाता प्रोफाइल, संपादन योग्य दर सीमा, सर्किट ब्रेकर स्थिति, नीतियां और लॉक पहचानकर्ता |
| एआई | बजट कॉन्फ़िगरेशन, ग्लोबल सिस्टम प्रॉम्प्ट इंजेक्शन, प्रॉम्प्ट कैश आँकड़े सोचना |
| उन्नत | वैश्विक प्रॉक्सी कॉन्फ़िगरेशन (HTTP/SOCKS5) |
लागत एवं बजट प्रबंधन
डैशबोर्ड → लागत के माध्यम से पहुंच।
| टैब | उद्देश्य |
|---|---|
| बजट | दैनिक/साप्ताहिक/मासिक बजट और वास्तविक समय ट्रैकिंग के साथ प्रति एपीआई कुंजी खर्च सीमा निर्धारित करें |
| मूल्य निर्धारण | मॉडल मूल्य निर्धारण प्रविष्टियाँ देखें और संपादित करें - प्रति प्रदाता प्रति 1K इनपुट/आउटपुट टोकन की लागत |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budget
लागत ट्रैकिंग: प्रत्येक अनुरोध टोकन उपयोग को लॉग करता है और मूल्य निर्धारण तालिका का उपयोग करके लागत की गणना करता है। प्रदाता, मॉडल और एपीआई कुंजी द्वारा डैशबोर्ड → उपयोग में विश्लेषण देखें।
ऑडियो ट्रांसक्रिप्शन
ओमनीरूट ओपनएआई-संगत एंडपॉइंट के माध्यम से ऑडियो ट्रांसक्रिप्शन का समर्थन करता है:
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"
उपलब्ध प्रदाता: डीपग्राम (deepgram/), AssemblyAI (assemblyai/)।
समर्थित ऑडियो प्रारूप: mp3, wav, m4a, flac, ogg, webm।
कॉम्बो संतुलन रणनीतियाँ
डैशबोर्ड → कॉम्बो → बनाएं/संपादित करें → रणनीति में प्रति-कॉम्बो संतुलन कॉन्फ़िगर करें।
| रणनीति | विवरण |
|---|---|
| राउंड-रॉबिन | मॉडलों के माध्यम से क्रमिक रूप से घूमता है |
| प्राथमिकता | हमेशा पहला मॉडल आज़माता है; केवल त्रुटि पर वापस आता है |
| यादृच्छिक | प्रत्येक अनुरोध के लिए कॉम्बो से एक यादृच्छिक मॉडल चुनता है |
| भारित | प्रति मॉडल निर्दिष्ट भार के आधार पर आनुपातिक रूप से मार्ग |
| कम से कम इस्तेमाल | सबसे कम हालिया अनुरोधों के साथ मॉडल पर रूट (कॉम्बो मेट्रिक्स का उपयोग करता है) |
| लागत-अनुकूलित | सबसे सस्ते उपलब्ध मॉडल के लिए मार्ग (मूल्य निर्धारण तालिका का उपयोग करता है) |
ग्लोबल कॉम्बो डिफॉल्ट्स को डैशबोर्ड → सेटिंग्स → रूटिंग → कॉम्बो डिफॉल्ट्स में सेट किया जा सकता है।
स्वास्थ्य डैशबोर्ड
डैशबोर्ड → स्वास्थ्य के माध्यम से पहुंच। 6 कार्डों के साथ वास्तविक समय प्रणाली स्वास्थ्य अवलोकन:
| कार्ड | यह क्या दिखाता है |
|---|---|
| सिस्टम स्थिति | अपटाइम, संस्करण, मेमोरी उपयोग, डेटा निर्देशिका |
| प्रदाता स्वास्थ्य | प्रति-प्रदाता सर्किट ब्रेकर स्थिति (बंद/खुला/आधा-खुला) |
| दर सीमा | शेष समय के साथ प्रति खाता सक्रिय दर सीमा को शांत करना |
| सक्रिय तालाबंदी | प्रदाताओं को तालाबंदी नीति द्वारा अस्थायी रूप से अवरुद्ध कर दिया गया है |
| हस्ताक्षर कैश | डिडुप्लीकेशन कैश आँकड़े (सक्रिय कुंजियाँ, हिट दर) |
| विलंबता टेलीमेट्री | प्रति प्रदाता p50/p95/p99 विलंबता एकत्रीकरण |
प्रो टिप: स्वास्थ्य पृष्ठ हर 10 सेकंड में स्वतः ताज़ा हो जाता है। यह पहचानने के लिए सर्किट ब्रेकर कार्ड का उपयोग करें कि कौन से प्रदाता समस्याओं का सामना कर रहे हैं।