在收到帳單前,掌握您的支出。
每個閘道請求都會即時定價、歸因並記錄。開箱即用的模型儀表板、月度預測和預算護欄 — 無需 Datadog 儀表板。
成本儀表板
每日支出趨勢、按模型分類的明細、前 10 個最昂貴的請求。您的財務長真正需要的視圖。
支出預測
將目前的消耗率預測至月底,讓您在超支發生前數週就能發現。
預算警示
每個金鑰的每月上限。在達到 80% 和 100% 時發送電子郵件,並設有冷卻時間,以避免垃圾郵件。可選的自動暫停功能可立即終止失控的循環。
簽名 Webhook
用於支出閾值、金鑰建立、金鑰撤銷、生成失敗的 HMAC 簽名事件。將它們連接到 PagerDuty、Slack 或您自己的分類帳。
中斷會發生。您的使用者不應察覺。
多供應商故障轉移、區域備援和意圖感知路由將脆弱的單一供應商依賴關係轉變為冗餘、自我修復的層級。
多供應商故障轉移
可配置每個金鑰的逾時和重試策略。在 5xx 或逾時時,流量會透明地轉移到鏈中的下一個供應商。
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
智慧路由
告訴我們您的意圖 — 快速聊天、深度推理、圖像編輯、長篇摘要 — 我們會選擇最便宜且合格的供應商。需要時可鎖定特定模型。
區域備援
如果供應商的美國東部區域降級,我們會嘗試美國西部,然後是歐盟,最後才使請求失敗。區域黏性可針對每個金鑰進行配置。
滿足安全審查的每個金鑰控制項。
範圍金鑰、精細的速率限制、IP 允許清單、不可變的稽核日誌和 CSV 匯出。專為您的 CTO 和稽核員都會提出的問題而設計。
API 金鑰範圍設定
每個金鑰的模型允許/拒絕、IP 允許清單、每日和每小時支出上限。無需重新部署即可輪換。
每個金鑰、每個模型的速率限制
RPM 和 TPM 限制範圍設定為金鑰和模型。暫存金鑰不會意外耗盡生產配額。
不可變的稽核日誌
每個建立的金鑰、變更的範圍、移動的預算或撤銷都會記錄執行者、IP 和時間戳記。預設為 SOC2 基準。
可搜尋日誌 + CSV 匯出
按端點、模型、狀態、延遲、金鑰篩選請求日誌。一鍵匯出 CSV,用於財務、合規性或事後分析。
合規性態勢
- TLS 1.2+ 端對端。金鑰靜態雜湊,絕不以純文字記錄。
- 每個租戶的金鑰 + 預算隔離。無跨租戶資料洩漏。
- 可配置的日誌保留。針對高敏感性工作負載,可按需刪除請求主體。
- 針對對資料駐留敏感的部署,可應要求提供歐盟和美國路由。
- SOC2 控制項預計於 2026 年納入範圍。如果您需要我們稽核員的最新信函,請與我們聯繫。
可直接替換 OpenAI SDK。只需更換一個基本 URL。
Hypereal 支援 OpenAI Chat Completions、Images、Responses 和 Anthropic Messages。保留您的 SDK、提示、工具定義、重試機制 — 只需更改基本 URL 和 API 金鑰,即可發佈。
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});支援的端點
- POST /v1/chat/completions — 相容於 OpenAI
- POST /v1/messages — 相容於 Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — 相容於 OpenAI
- POST /v1/videos/generate — Hypereal 影片 API
- POST /v1/comfy/{slug} — ComfyUI 工作流程作為 API
- POST /v1/gpu/{slug} — 無伺服器 GPU 直通
超越模型:運算作為一流的 API。
每個團隊最終都需要的不僅僅是聊天補全——一個客製化的 ComfyUI 圖形、一個微調、一個一次性的 GPU 工作。Hypereal 將這些都透過相同的金鑰、相同的日誌、相同的預算來公開。
無伺服器 GPU 直通
帶上你自己的 RunPod 處理器,並將其作為 POST /v1/gpu/{slug} 呼叫。我們處理身份驗證、計量、重試和帳單。你負責編寫處理器。
ComfyUI 工作流程作為 API
上傳任何 ComfyUI 工作流程 JSON。我們為你提供一個帶有類型化輸入和輸出的版本化 HTTP 端點,按每次執行計費。不再需要在 Slack 中貼上圖形。
ComfyUI 函式庫
不斷增長的預建 ComfyUI 工作流程目錄——臉部修復、產品拍攝、電影級升級——像呼叫任何其他模型一樣呼叫它們。
LoRA 和資產儲存庫
用於 LoRA、檢查點、嵌入和參考圖像的私有、版本化儲存空間。從任何工作流程或生成中透過句柄引用它們。
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}我們發布的數字。而不是銷售簡報中的截圖。
即時狀態頁面、透明的延遲,以及無需事先詢問我們即可閱讀的事件歷史記錄。
透明延遲
按區域劃分的每個閘道端點的滾動 p50 和 p95。
正常運行時間歷史記錄
過去 30/90 天的正常運行時間,沒有行銷話術。數字就是數字。

