Платформата Hypereal

Enterprise AI Gateway + Compute Platform

Един ключ. Всеки модел, всеки GPU, всеки ComfyUI workflow. С разходите, одита и надеждността, за които вашите CFO и CTO вече попитаха.

Вземете API ключ Свържете се с продажби

Използва се в production от екипи, които доставят image, video, voice и chat функции на милиони крайни потребители.

Цена и разходи

Знайте какво харчите, преди да пристигне фактурата.

Всяка заявка през gateway-а се ценообразува, атрибутира и записва в реално време. Табла по модел, месечни прогнози и бюджетни предпазни ограничения — веднага, без да е необходимо табло в Datadog.

Табло за разходи

Дневна тенденция на разходите, разбивка по модел, топ 10 на най-скъпите заявки. Изгледът, който CFO-то ви всъщност поиска.

Прогноза за разходите

Текущата норма на изгаряне, прогнозирана до края на месеца, за да виждате надвишенията седмици преди да ударят картата ви.

Алерти за бюджет

Месечен лимит за всеки ключ. Имейли при 80% и 100% с cooldown, за да не бъдете спамвани. Опционално автоматично паузиране спира безконтролни цикли на място.

Подписани webhooks

HMAC-подписани събития за прагове на разходите, създаден ключ, отнет ключ, неуспешно генериране. Свържете ги с PagerDuty, Slack или собствената си счетоводна система.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Надеждност

Прекъсвания се случват. Потребителите ви не бива да ги забелязват.

Failover между множество доставчици, регионален fallback и маршрутизиране, съобразено с намерението, превръщат крехката зависимост от един доставчик в излишен, самооздравяващ слой.

Failover между множество доставчици

Конфигурируеми timeout-и и retry политика за всеки ключ. При 5xx или timeout трафикът прозрачно се прехвърля към следващия доставчик във веригата.

Примерна fallback верига

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Вашата заявка никога не вижда неуспешния hop. Латентният бюджет се прилага от край до край.

Умно маршрутизиране

Кажете ни намерението — бърз чат, дълбоко разсъждение, редакция на изображение, дълга обобщаваща обработка — и ние избираме най-евтиния квалифициран доставчик. Закрепете точен модел, когато имате нужда от това.

Регионален fallback

Ако US-East регионът на даден доставчик е с влошена работа, опитваме US-West, после EU, преди да върнем грешка за заявката. Region-stickiness е конфигурируема за всеки ключ.

Управление и сигурност

Контроли на ниво ключ, които издържат на security review.

Ключове със scope, гранулирани rate limit-и, IP allowlist, неизменяем audit log и CSV export. Създадено за въпросите, които и CTO-то, и одиторът ви ще зададат.

Scope на API ключ

Allow/deny по модели за всеки ключ, IP allowlist, дневни и почасови бюджетни лимити. Завъртайте ключовете без redeploy.

Rate limit-и за всеки ключ и модел

RPM и TPM лимити, обхванати за ключа и модела. Staging ключ не може случайно да източи квотата на production.

Неизменяем audit log

Всеки създаден ключ, промяна в scope-а, преместване на бюджет или отнемане се записва с извършител, IP и timestamp. SOC2-базовост по подразбиране.

Търсими log-ове + CSV export

Филтрирайте log-овете на заявките по endpoint, модел, статус, latency, ключ. CSV с един клик за финанси, compliance или post-mortem.

Позиция по compliance

TLS 1.2+ от край до край. Ключовете са хеширани при съхранение и никога не се log-ват в plaintext.
Изолация на ключовете и бюджета за всеки tenant. Няма cross-tenant изтичане на данни.
Конфигурируем retention на log-овете. Премахвайте телата на заявките при нужда за workloads с висока чувствителност.
EU и US маршрутизиране е налично при заявка за deployments с изисквания за data residency.
SOC2 контроли са в обхват за 2026. Свържете се с нас, ако ви трябва актуално писмо от нашия одитор.

Съвместимост

Drop-in за OpenAI SDK. Подменете само base URL.

Hypereal поддържа OpenAI Chat Completions, Images, Responses и Anthropic Messages. Запазете SDK-то, prompt-овете, дефинициите на tools, retry логиката си — сменете base URL и API ключа и пускайте.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Поддържани endpoints

POST /v1/chat/completions — съвместим с OpenAI
POST /v1/messages — съвместим с Anthropic
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — съвместим с OpenAI
POST /v1/videos/generate — Hypereal video API
POST /v1/comfy/{slug} — ComfyUI workflow като API
POST /v1/gpu/{slug} — serverless GPU passthrough

Изчисления

Повече от модели: изчисленията като първокласно API.

Всяка команда в един момент се нуждае от нещо повече от chat completions — custom ComfyUI граф, fine-tune или еднократна GPU задача. Hypereal ги предоставя зад същия ключ, същите log-ове и същите бюджети.

Serverless GPU Passthrough

Използвайте собствен RunPod handler и го извиквайте като POST /v1/gpu/{slug}. Ние поемаме auth, metering-а, retry-тата и сметката. Вие пишете handler-а.

ComfyUI Workflow като API

Качете който и да е ComfyUI workflow JSON. Ние ви даваме versioned HTTP endpoint с типизирани входове и изходи, таксуван на изпълнение. Край на поставянето на графи в Slack.

ComfyUI библиотека

Разрастващ се каталог от предварително изградени ComfyUI workflows — възстановяване на лице, продуктова снимка, cinematic upscale — извиквайте ги като всеки друг модел.

LoRA и asset хранилище

Частно, versioned хранилище за LoRA, checkpoints, embeddings и reference изображения. Реферирайте ги по handle от който и да е workflow или генериране.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Статус и доверие

Числа, които публикуваме. Не screenshots в sales deck.

Публична status страница, прозрачна latency и история на инцидентите, която можете да прочетете, без първо да ни питате.

Публична status страница

Жив статус и timeline на инцидентите за всеки endpoint.

Вижте status страницата

Прозрачна latency

Rolling p50 и p95 за всеки gateway endpoint, по регион.

История на uptime

Последните 30/90 дни uptime, без маркетингови сметки. Числото е числото.

Спрете да управлявате 8 vendor dashboard-а.

Един API ключ, една сметка, едно място, където да виждате какво се случва. Започнете за по-малко от пет минути.

Вземете API ключ Говорете с продажбите Прочетете документацията

Enterprise AI Gateway + Compute Platform

Използва се в production от екипи, които доставят image, video, voice и chat функции на милиони крайни потребители.

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });

Спрете да управлявате 8 vendor dashboard-а.

Един API ключ, една сметка, едно място, където да виждате какво се случва. Започнете за по-малко от пет минути.