Enterprise AI Gateway + Compute Platform
Един ключ. Всеки модел, всеки GPU, всеки ComfyUI workflow. С разходите, одита и надеждността, за които вашите CFO и CTO вече попитаха.
Използва се в production от екипи, които доставят image, video, voice и chat функции на милиони крайни потребители.
Знайте какво харчите, преди да пристигне фактурата.
Всяка заявка през gateway-а се ценообразува, атрибутира и записва в реално време. Табла по модел, месечни прогнози и бюджетни предпазни ограничения — веднага, без да е необходимо табло в Datadog.
Табло за разходи
Дневна тенденция на разходите, разбивка по модел, топ 10 на най-скъпите заявки. Изгледът, който CFO-то ви всъщност поиска.
Прогноза за разходите
Текущата норма на изгаряне, прогнозирана до края на месеца, за да виждате надвишенията седмици преди да ударят картата ви.
Алерти за бюджет
Месечен лимит за всеки ключ. Имейли при 80% и 100% с cooldown, за да не бъдете спамвани. Опционално автоматично паузиране спира безконтролни цикли на място.
Подписани webhooks
HMAC-подписани събития за прагове на разходите, създаден ключ, отнет ключ, неуспешно генериране. Свържете ги с PagerDuty, Slack или собствената си счетоводна система.
Прекъсвания се случват. Потребителите ви не бива да ги забелязват.
Failover между множество доставчици, регионален fallback и маршрутизиране, съобразено с намерението, превръщат крехката зависимост от един доставчик в излишен, самооздравяващ слой.
Failover между множество доставчици
Конфигурируеми timeout-и и retry политика за всеки ключ. При 5xx или timeout трафикът прозрачно се прехвърля към следващия доставчик във веригата.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Умно маршрутизиране
Кажете ни намерението — бърз чат, дълбоко разсъждение, редакция на изображение, дълга обобщаваща обработка — и ние избираме най-евтиния квалифициран доставчик. Закрепете точен модел, когато имате нужда от това.
Регионален fallback
Ако US-East регионът на даден доставчик е с влошена работа, опитваме US-West, после EU, преди да върнем грешка за заявката. Region-stickiness е конфигурируема за всеки ключ.
Контроли на ниво ключ, които издържат на security review.
Ключове със scope, гранулирани rate limit-и, IP allowlist, неизменяем audit log и CSV export. Създадено за въпросите, които и CTO-то, и одиторът ви ще зададат.
Scope на API ключ
Allow/deny по модели за всеки ключ, IP allowlist, дневни и почасови бюджетни лимити. Завъртайте ключовете без redeploy.
Rate limit-и за всеки ключ и модел
RPM и TPM лимити, обхванати за ключа и модела. Staging ключ не може случайно да източи квотата на production.
Неизменяем audit log
Всеки създаден ключ, промяна в scope-а, преместване на бюджет или отнемане се записва с извършител, IP и timestamp. SOC2-базовост по подразбиране.
Търсими log-ове + CSV export
Филтрирайте log-овете на заявките по endpoint, модел, статус, latency, ключ. CSV с един клик за финанси, compliance или post-mortem.
Позиция по compliance
- TLS 1.2+ от край до край. Ключовете са хеширани при съхранение и никога не се log-ват в plaintext.
- Изолация на ключовете и бюджета за всеки tenant. Няма cross-tenant изтичане на данни.
- Конфигурируем retention на log-овете. Премахвайте телата на заявките при нужда за workloads с висока чувствителност.
- EU и US маршрутизиране е налично при заявка за deployments с изисквания за data residency.
- SOC2 контроли са в обхват за 2026. Свържете се с нас, ако ви трябва актуално писмо от нашия одитор.
Drop-in за OpenAI SDK. Подменете само base URL.
Hypereal поддържа OpenAI Chat Completions, Images, Responses и Anthropic Messages. Запазете SDK-то, prompt-овете, дефинициите на tools, retry логиката си — сменете base URL и API ключа и пускайте.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Поддържани endpoints
- POST /v1/chat/completions — съвместим с OpenAI
- POST /v1/messages — съвместим с Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — съвместим с OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow като API
- POST /v1/gpu/{slug} — serverless GPU passthrough
Повече от модели: изчисленията като първокласно API.
Всяка команда в един момент се нуждае от нещо повече от chat completions — custom ComfyUI граф, fine-tune или еднократна GPU задача. Hypereal ги предоставя зад същия ключ, същите log-ове и същите бюджети.
Serverless GPU Passthrough
Използвайте собствен RunPod handler и го извиквайте като POST /v1/gpu/{slug}. Ние поемаме auth, metering-а, retry-тата и сметката. Вие пишете handler-а.
ComfyUI Workflow като API
Качете който и да е ComfyUI workflow JSON. Ние ви даваме versioned HTTP endpoint с типизирани входове и изходи, таксуван на изпълнение. Край на поставянето на графи в Slack.
ComfyUI библиотека
Разрастващ се каталог от предварително изградени ComfyUI workflows — възстановяване на лице, продуктова снимка, cinematic upscale — извиквайте ги като всеки друг модел.
LoRA и asset хранилище
Частно, versioned хранилище за LoRA, checkpoints, embeddings и reference изображения. Реферирайте ги по handle от който и да е workflow или генериране.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Числа, които публикуваме. Не screenshots в sales deck.
Публична status страница, прозрачна latency и история на инцидентите, която можете да прочетете, без първо да ни питате.
Публична status страница
Жив статус и timeline на инцидентите за всеки endpoint.
Вижте status страницатаПрозрачна latency
Rolling p50 и p95 за всеки gateway endpoint, по регион.
История на uptime
Последните 30/90 дни uptime, без маркетингови сметки. Числото е числото.
Спрете да управлявате 8 vendor dashboard-а.
Един API ключ, една сметка, едно място, където да виждате какво се случва. Започнете за по-малко от пет минути.

