在收到账单前,了解您的支出。
每个网关请求都实时定价、归因和记录。开箱即用的模型控制台、月度预测和预算护栏——无需Datadog控制台。
成本控制台
每日支出趋势、按模型细分、前10个最昂贵的请求。您的CFO真正需要的视图。
支出预测
将当前消耗率预测到月底,以便您在超支发生前数周就能发现。
预算警报
每个API密钥的月度上限。在达到80%和100%时发送电子邮件,并有冷却时间,避免垃圾邮件。可选的自动暂停功能可立即终止失控的循环。
签名Webhooks
用于支出阈值、API密钥创建、API密钥撤销、生成失败的HMAC签名事件。将其连接到PagerDuty、Slack或您自己的账本。
故障会发生。您的用户不应该察觉。
多提供商故障转移、区域回退和意图感知路由将脆弱的单供应商依赖转化为冗余、自愈的层。
多提供商故障转移
可配置的每个API密钥超时和重试策略。在5xx错误或超时时,流量透明地切换到链中的下一个提供商。
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
智能路由
告诉我们您的意图——快速聊天、深度推理、图像编辑、长篇摘要——我们选择最便宜且合格的提供商。当您需要时,可以指定精确的模型。
区域回退
如果提供商的美国东部区域降级,我们会尝试美国西部,然后是欧盟,最后才使请求失败。区域粘性可按每个API密钥配置。
满足安全审查的每个API密钥控制。
范围限定的API密钥、精细的速率限制、IP白名单、不可变审计日志和CSV导出。专为您的CTO和审计师都会提出的问题而设计。
API 密钥范围限定
每个密钥的模型允许/拒绝、IP 允许列表、每日和每小时支出上限。无需重新部署即可轮换。
每个密钥、每个模型的速率限制
RPM 和 TPM 限制范围限定到密钥和模型。暂存密钥不会意外耗尽生产配额。
不可变审计日志
每个密钥的创建、范围更改、预算移动或撤销都会记录参与者、IP 和时间戳。默认符合 SOC2 基线。
可搜索日志 + CSV 导出
按端点、模型、状态、延迟、密钥筛选请求日志。一键导出 CSV,用于财务、合规性或事后分析。
合规性态势
- TLS 1.2+ 端到端加密。密钥静态哈希,绝不以明文形式记录。
- 每个租户的密钥 + 预算隔离。无跨租户数据泄露。
- 可配置的日志保留。对于高敏感性工作负载,可按需删除请求正文。
- 对于对数据驻留敏感的部署,可应要求提供欧盟和美国路由。
- SOC2 控制范围将于 2026 年生效。如果您需要我们审计师的当前信函,请联系我们。
即插即用 OpenAI SDK。只需更换一个基础 URL。
Hypereal 支持 OpenAI 聊天补全、图像、响应和 Anthropic 消息。保留您的 SDK、提示、工具定义、重试机制——只需更改基础 URL 和 API 密钥,即可发布。
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});支持的端点
- POST /v1/chat/completions — 兼容 OpenAI
- POST /v1/messages — 兼容 Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — 兼容 OpenAI
- POST /v1/videos/generate — Hypereal 视频 API
- POST /v1/comfy/{slug} — ComfyUI 工作流作为 API
- POST /v1/gpu/{slug} — 无服务器 GPU 直通
超越模型:计算作为一流API。
每个团队最终都需要比聊天完成更多的功能——自定义 ComfyUI 图、微调、一次性 GPU 作业。Hypereal 将这些功能通过相同的密钥、相同的日志、相同的预算进行公开。
无服务器 GPU 直通
带上您自己的 RunPod 处理程序,并将其作为 POST /v1/gpu/{slug} 调用。我们处理身份验证、计量、重试和账单。您编写处理程序。
ComfyUI 工作流即 API
上传任何 ComfyUI 工作流 JSON。我们为您提供一个带有类型化输入和输出的版本化 HTTP 端点,按运行计费。无需再在 Slack 中粘贴图表。
ComfyUI 库
不断增长的预构建 ComfyUI 工作流目录——人脸修复、产品拍摄、电影级放大——像调用任何其他模型一样调用它们。
LoRA 和资产库
用于 LoRA、检查点、嵌入和参考图像的私有、版本化存储。通过句柄从任何工作流或生成中引用它们。
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}我们公布的数据,而非销售演示文稿中的截图。
实时状态页面、透明的延迟以及无需事先询问即可查阅的事件历史记录。

