# API 参考 🌐 **Languages:** 🇺🇸 [English](../../API_REFERENCE.md) | 🇧🇷 [Português (Brasil)](../pt-BR/API_REFERENCE.md) | 🇪🇸 [Español](../es/API_REFERENCE.md) | 🇫🇷 [Français](../fr/API_REFERENCE.md) | 🇮🇹 [Italiano](../it/API_REFERENCE.md) | 🇷🇺 [Русский](../ru/API_REFERENCE.md) | 🇨🇳 [中文 (简体)](../zh-CN/API_REFERENCE.md) | 🇩🇪 [Deutsch](../de/API_REFERENCE.md) | 🇮🇳 [हिन्दी](../in/API_REFERENCE.md) | 🇹🇭 [ไทย](../th/API_REFERENCE.md) | 🇺🇦 [Українська](../uk-UA/API_REFERENCE.md) | 🇸🇦 [العربية](../ar/API_REFERENCE.md) | 🇯🇵 [日本語](../ja/API_REFERENCE.md) | 🇻🇳 [Tiếng Việt](../vi/API_REFERENCE.md) | 🇧🇬 [Български](../bg/API_REFERENCE.md) | 🇩🇰 [Dansk](../da/API_REFERENCE.md) | 🇫🇮 [Suomi](../fi/API_REFERENCE.md) | 🇮🇱 [עברית](../he/API_REFERENCE.md) | 🇭🇺 [Magyar](../hu/API_REFERENCE.md) | 🇮🇩 [Bahasa Indonesia](../id/API_REFERENCE.md) | 🇰🇷 [한국어](../ko/API_REFERENCE.md) | 🇲🇾 [Bahasa Melayu](../ms/API_REFERENCE.md) | 🇳🇱 [Nederlands](../nl/API_REFERENCE.md) | 🇳🇴 [Norsk](../no/API_REFERENCE.md) | 🇵🇹 [Português (Portugal)](../pt/API_REFERENCE.md) | 🇷🇴 [Română](../ro/API_REFERENCE.md) | 🇵🇱 [Polski](../pl/API_REFERENCE.md) | 🇸🇰 [Slovenčina](../sk/API_REFERENCE.md) | 🇸🇪 [Svenska](../sv/API_REFERENCE.md) | 🇵🇭 [Filipino](../phi/API_REFERENCE.md) 所有 OmniRoute API 端点的完整参考。 --- ## 目录 - [Chat Completions](#chat-completions) - [Embeddings](#embeddings) - [Image Generation](#image-generation) - [List Models](#list-models) - [Compatibility Endpoints](#compatibility-endpoints) - [Semantic Cache](#semantic-cache) - [Dashboard & Management](#dashboard--management) - [Request Processing](#request-processing) - [Authentication](#authentication) --- ## 聊天完成 ```bash POST /v1/chat/completions Authorization: Bearer your-api-key Content-Type: application/json { "model": "cc/claude-opus-4-6", "messages": [ {"role": "user", "content": "Write a function to..."} ], "stream": true } ``` ### 自定义标头 | 标题 | 方向 | 描述 | | ------------------------ | ---- | ----------------------------- | | `X-OmniRoute-No-Cache` | 请求 | 设置为 `true` 以绕过缓存 | | `X-OmniRoute-Progress` | 请求 | 对于进度事件设置为 `true` | | `Idempotency-Key` | 请求 | Dedup 密钥(5 秒窗口) | | `X-Request-Id` | 请求 | 替代重复数据删除密钥 | | `X-OmniRoute-Cache` | 回应 | `HIT` 或 `MISS`(非流式传输) | | `X-OmniRoute-Idempotent` | 回应 | `true` 如果已进行重复数据删除 | | `X-OmniRoute-Progress` | 回应 | `enabled` 如果进度跟踪开启 | --- ## 嵌入 ```bash POST /v1/embeddings Authorization: Bearer your-api-key Content-Type: application/json { "model": "nebius/Qwen/Qwen3-Embedding-8B", "input": "The food was delicious" } ``` 可用的提供商:Nebius、OpenAI、Mistral、Together AI、Fireworks、NVIDIA。 ```bash # List all embedding models GET /v1/embeddings ``` --- ## 图像生成 ```bash POST /v1/images/generations Authorization: Bearer your-api-key Content-Type: application/json { "model": "openai/dall-e-3", "prompt": "A beautiful sunset over mountains", "size": "1024x1024" } ``` 可用的提供商:OpenAI (DALL-E)、xAI (Grok Image)、Together AI (FLUX)、Fireworks AI。 ```bash # List all image models GET /v1/images/generations ``` --- ## 列出型号 ```bash GET /v1/models Authorization: Bearer your-api-key → Returns all chat, embedding, and image models + combos in OpenAI format ``` --- ## 兼容性端点 |方法|路径|格式| | ------ | ------------------------ | | ---------------------- | |发布 | `/v1/chat/completions` |开放人工智能 | |发布 | `/v1/messages` |人择 | |发布 | `/v1/responses` | OpenAI 回应 | |发布 | `/v1/embeddings` |开放人工智能 | |发布 | `/v1/images/generations` |开放人工智能 | |获取 | `/v1/models` |开放人工智能 | |发布 | `/v1/messages/count_tokens` |人择 | |获取 | `/v1beta/models` |双子座| |发布 | `/v1beta/models/{...path}` |双子座生成内容 | |发布 | `/v1/api/chat` |奥拉玛 | ### 专用提供商路线 ```bash POST /v1/providers/{provider}/chat/completions POST /v1/providers/{provider}/embeddings POST /v1/providers/{provider}/images/generations ``` 如果缺少提供商前缀,则会自动添加。不匹配的模型返回 `400`。 --- ## 语义缓存 ```bash # Get cache stats GET /api/cache # Clear all caches DELETE /api/cache ``` 响应示例: ```json { "semanticCache": { "memorySize": 42, "memoryMaxSize": 500, "dbSize": 128, "hitRate": 0.65 }, "idempotency": { "activeKeys": 3, "windowMs": 5000 } } ``` --- ## 仪表板和管理 ### 身份验证 | 端点 | 方法 | 描述 | | ----------------------------- | --------- | ------------ | | `/api/auth/login` | 发布 | 登录 | | `/api/auth/logout` | 发布 | 退出 | | `/api/settings/require-login` | 获取/放置 | 切换需要登录 | ### 提供商管理 | 端点 | 方法 | 描述 | | ---------------------------- | -------------- | --------------- | | `/api/providers` | 获取/发布 | 列出/创建提供商 | | `/api/providers/[id]` | 获取/放置/删除 | 管理提供商 | | `/api/providers/[id]/test` | 发布 | 测试提供商连接 | | `/api/providers/[id]/models` | 获取 | 列出供应商型号 | | `/api/providers/validate` | 发布 | 验证提供商配置 | | `/api/provider-nodes*` | 各种 | 提供商节点管理 | | `/api/provider-models` | 获取/发布/删除 | 定制型号 | ### OAuth 流程 | 端点 | 方法 | 描述 | | -------------------------------- | ---- | -------------------- | | `/api/oauth/[provider]/[action]` | 各种 | 特定于提供商的 OAuth | ### 路由和配置 | 端点 | 方法 | 描述 | | --------------------- | --------- | --------------------------- | | `/api/models/alias` | 获取/发布 | 模型别名 | | `/api/models/catalog` | 获取 | 按提供商+类型列出的所有型号 | | `/api/combos*` | 各种 | 组合管理 | | `/api/keys*` | 各种 | API 密钥管理 | | `/api/pricing` | 获取 | 型号定价 | ### 使用与分析 |端点 |方法|描述 | | ------------------------ | | ------ | -------------------- | | `/api/usage/history` |获取 |使用历史 | | `/api/usage/logs` |获取 |使用日志 | | `/api/usage/request-logs` |获取 |请求级日志 | | `/api/usage/[connectionId]` |获取 |每个连接的使用情况 | ### 设置 | 端点 | 方法 | 描述 | | ------------------------------- | --------- | -------------------- | | `/api/settings` | 获取/放置 | 常规设置 | | `/api/settings/proxy` | 获取/放置 | 网络代理配置 | | `/api/settings/proxy/test` | 发布 | 测试代理连接 | | `/api/settings/ip-filter` | 获取/放置 | IP 允许列表/阻止列表 | | `/api/settings/thinking-budget` | 获取/放置 | 推理代币预算 | | `/api/settings/system-prompt` | 获取/放置 | 全局系统提示 | ### 监控 | 端点 | 方法 | 描述 | | ------------------------ | --------- | ------------------ | | `/api/sessions` | 获取 | 活动会话跟踪 | | `/api/rate-limits` | 获取 | 每个帐户的费率限制 | | `/api/monitoring/health` | 获取 | 健康检查 | | `/api/cache` | 获取/删除 | 缓存统计/清除 | ### 备份和导出/导入 |端点 |方法|描述 | | ------------------------ | | ------ | --------------------------------------- | | `/api/db-backups` |获取 |列出可用备份 | | `/api/db-backups` |放置 |创建手动备份 | | `/api/db-backups` |发布 |从特定备份恢复| | `/api/db-backups/export` |获取 |将数据库下载为 .sqlite 文件 | | `/api/db-backups/import` |发布 |上传.sqlite 文件来替换数据库 | | `/api/db-backups/exportAll` |获取 |下载完整备份为 .tar.gz 存档 | ### 云同步 | 端点 | 方法 | 描述 | | ---------------------- | ---- | ---------- | | `/api/sync/cloud` | 各种 | 云同步操作 | | `/api/sync/initialize` | 发布 | 初始化同步 | | `/api/cloud/*` | 各种 | 云管理 | ### CLI 工具 | 端点 | 方法 | 描述 | | ---------------------------------- | ---- | ----------------- | | `/api/cli-tools/claude-settings` | 获取 | 克劳德 CLI 状态 | | `/api/cli-tools/codex-settings` | 获取 | Codex CLI 状态 | | `/api/cli-tools/droid-settings` | 获取 | Droid CLI 状态 | | `/api/cli-tools/openclaw-settings` | 获取 | OpenClaw CLI 状态 | | `/api/cli-tools/runtime/[toolId]` | 获取 | 通用 CLI 运行时 | CLI 响应包括:`installed`、`runnable`、`command`、`commandPath`、`runtimeMode`、`reason`。 ### 弹性和速率限制 | 端点 | 方法 | 描述 | | ----------------------- | --------- | ---------------------- | | `/api/resilience` | 获取/放置 | 获取/更新弹性配置文件 | | `/api/resilience/reset` | 发布 | 重置断路器 | | `/api/rate-limits` | 获取 | 每个帐户的速率限制状态 | | `/api/rate-limit` | 获取 | 全局限速配置 | ### 评估 | 端点 | 方法 | 描述 | | ------------ | --------- | --------------------- | | `/api/evals` | 获取/发布 | 列出评估套件/运行评估 | ### 政策 | 端点 | 方法 | 描述 | | --------------- | -------------- | ------------ | | `/api/policies` | 获取/发布/删除 | 管理路由策略 | ### 合规性 |端点 |方法|描述 | | ------------------------ | | ------ | -------------------------------------- | | `/api/compliance/audit-log` |获取 |合规审核日志(最后 N)| ### v1beta(Gemini 兼容) | 端点 | 方法 | 描述 | | -------------------------- | ---- | ----------------------------- | | `/v1beta/models` | 获取 | 以 Gemini 格式列出模型 | | `/v1beta/models/{...path}` | 发布 | Gemini `generateContent` 端点 | 这些端点反映了 Gemini 的 API 格式,适用于期望本机 Gemini SDK 兼容性的客户端。 ### 内部/系统 API | 端点 | 方法 | 描述 | | --------------- | ---- | ------------------------------------------- | | `/api/init` | 获取 | 应用程序初始化检查(首次运行时使用) | | `/api/tags` | 获取 | Ollama 兼容模型标签(适用于 Ollama 客户端) | | `/api/restart` | 发布 | 触发服务器优雅重启 | | `/api/shutdown` | 发布 | 触发服务器正常关闭 | > **注意:** 这些端点由系统内部使用或用于 Ollama 客户端兼容性。最终用户通常不会调用它们。 --- ## 音频转录 ```bash POST /v1/audio/transcriptions Authorization: Bearer your-api-key Content-Type: multipart/form-data ``` 使用 Deepgram 或 AssemblyAI 转录音频文件。 **要求:** ```bash curl -X POST http://localhost:20128/v1/audio/transcriptions \ -H "Authorization: Bearer your-api-key" \ -F "file=@recording.mp3" \ -F "model=deepgram/nova-3" ``` **回应:** ```json { "text": "Hello, this is the transcribed audio content.", "task": "transcribe", "language": "en", "duration": 12.5 } ``` **支持的提供商:** `deepgram/nova-3`、`assemblyai/best`。 **支持的格式:** `mp3`、`wav`、`m4a`、`flac`、`ogg`、`webm`。 --- ## 奥拉马兼容性 对于使用 Ollama 的 API 格式的客户端: ```bash # Chat endpoint (Ollama format) POST /v1/api/chat # Model listing (Ollama format) GET /api/tags ``` 请求会在 Ollama 和内部格式之间自动转换。 --- ## 遥测 ```bash # Get latency telemetry summary (p50/p95/p99 per provider) GET /api/telemetry/summary ``` **回应:** ```json { "providers": { "claudeCode": { "p50": 245, "p95": 890, "p99": 1200, "count": 150 }, "github": { "p50": 180, "p95": 620, "p99": 950, "count": 320 } } } ``` --- ## 预算 ```bash # Get budget status for all API keys GET /api/usage/budget # Set or update a budget POST /api/usage/budget Content-Type: application/json { "keyId": "key-123", "limit": 50.00, "period": "monthly" } ``` --- ## 型号可用性 ```bash # Get real-time model availability across all providers GET /api/models/availability # Check availability for a specific model POST /api/models/availability Content-Type: application/json { "model": "claude-sonnet-4-5-20250929" } ``` --- ## 请求处理 1. 客户端向`/v1/*`发送请求 2. 路由处理程序调用 `handleChat`、`handleEmbedding`、`handleAudioTranscription` 或 `handleImageGeneration` 3. 模型已解析(直接提供者/模型或别名/组合) 4. 通过帐户可用性过滤从本地数据库中选择凭证 5. 对于聊天:`handleChatCore` — 格式检测、翻译、缓存检查、幂等性检查 6. Provider执行器发送上游请求 7. 响应转换回客户端格式(聊天)或按原样返回(嵌入/图像/音频) 8. 使用/日志记录 9. 根据组合规则对错误应用回退 完整架构参考:[link](ARCHITECTURE.md) --- ## 身份验证 - 仪表板路由 (`/dashboard/*`) 使用 `auth_token` cookie - 登录使用保存的密码哈希;回退到 `INITIAL_PASSWORD` - `requireLogin` 可通过 `/api/settings/require-login` 切换 - `/v1/*` 路由在 `REQUIRE_API_KEY=true` 时可选择需要 Bearer API 密钥