Enterprise AI Gateway + Compute Platform
Jeden kľúč. Každý model, každé GPU, každý ComfyUI workflow. S nákladmi, auditom a spoľahlivosťou, na ktorú sa už pýtal váš CFO a CTO.
Používané v produkcii tímami, ktoré doručujú funkcie pre obrázky, video, hlas a chat miliónom koncových používateľov.
Vedzte, koľko míňate, skôr než dorazí faktúra.
Každá požiadavka gateway je nacenená, priradená a zaznamenaná v reálnom čase. Prehľady podľa modelu, mesačné prognózy a rozpočtové mantinely — hneď po vybalení, bez potreby Datadog dashboardu.
Prehľad nákladov
Denný trend výdavkov, rozpis podľa modelu, 10 najdrahších požiadaviek. Pohľad, o ktorý si váš CFO skutočne požiadal.
Predpoveď výdavkov
Kumulovaná miera spaľovania projektovaná do konca mesiaca, aby ste videli prekročenia už týždne predtým, než sa objavia na vašej karte.
Upozornenia na rozpočet
Mesačný strop pre každý kľúč. E-maily pri 80 % a 100 % s cooldownom, aby vás nezasypali spamom. Voliteľné automatické pozastavenie zastaví nekontrolované slučky úplne.
Podpísané webhooky
Udalosti podpísané HMAC pre prahy výdavkov, vytvorenie kľúča, zrušenie kľúča, zlyhané generovanie. Prepojte ich s PagerDuty, Slack alebo vašou vlastnou účtovnou knihou.
Výpadky sa dejú. Vaši používatelia by si to nemali všimnúť.
Failover medzi viacerými poskytovateľmi, regionálny fallback a smerovanie podľa zámeru premieňajú krehkú závislosť od jedného dodávateľa na redundantnú, samoopravnú vrstvu.
Failover medzi viacerými poskytovateľmi
Konfigurovateľné timeouty a retry politika pre každý kľúč. Pri 5xx alebo timeoutoch sa prevádzka transparentne presunie na ďalšieho poskytovateľa v reťazci.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Inteligentné smerovanie
Povedzte nám zámer — rýchly chat, hlboké uvažovanie, úprava obrázka, dlhé sumarizovanie — a my vyberieme najlacnejšieho kvalifikovaného poskytovateľa. Keď potrebujete, pripnite presný model.
Regionálny fallback
Ak je región US-East u poskytovateľa degradovaný, skúšame US-West a potom EU, skôr než požiadavka zlyhá. Regionálna viazanosť je konfigurovateľná pre každý kľúč.
Ovládacie prvky pre každý kľúč, ktoré prejdú bezpečnostným auditom.
Ohraničené kľúče, granulárne limity požiadaviek, IP allowlisty, nemenný auditný log a export do CSV. Navrhnuté pre otázky, ktoré položia váš CTO aj audítor.
Ohraničenie API kľúčov
Povolenie/zakázanie modelov pre každý kľúč, IP allowlist, denné a hodinové limity výdavkov. Rotujte bez redeployu.
Limity požiadaviek pre každý kľúč a model
RPM a TPM limity viazané na kľúč a model. Staging kľúč nemôže omylom vyčerpať kvótu produkcie.
Nemenný auditný log
Každé vytvorenie kľúča, zmena rozsahu, presun rozpočtu alebo zrušenie sa zaznamená s aktérom, IP a časovou pečiatkou. Základ SOC2 predvolene.
Prehľadávateľné logy + export do CSV
Filtrovanie logov požiadaviek podľa endpointu, modelu, stavu, latencie, kľúča. CSV na jedno kliknutie pre financie, compliance alebo post-mortem.
Stav compliance
- TLS 1.2+ end-to-end. Kľúče hashované pri uložení, nikdy nezaznamenané v plaintext.
- Izolácia kľúčov + rozpočtu pre každého tenant-a. Žiadny únik dát medzi tenantmi.
- Konfigurovateľná retencia logov. Na požiadanie zahoďte telá požiadaviek pre vysoko citlivé úlohy.
- Smerovanie v EÚ a USA dostupné na požiadanie pre nasadenia citlivé na rezidenciu dát.
- Ovládacie prvky SOC2 budú v rozsahu pre rok 2026. Ozvite sa, ak potrebujete aktuálne potvrdenie od nášho audítora.
Drop-in pre OpenAI SDK. Stačí vymeniť jednu base URL.
Hypereal hovorí OpenAI Chat Completions, Images, Responses a Anthropic Messages. Nechajte si SDK, prompty, definície nástrojov aj retry mechanizmy — zmeňte base URL a API kľúč a deploynite.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Podporované endpointy
- POST /v1/chat/completions — kompatibilné s OpenAI
- POST /v1/messages — kompatibilné s Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — kompatibilné s OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — workflow ComfyUI ako API
- POST /v1/gpu/{slug} — serverless GPU passthrough
Viac než modely: compute ako API prvej triedy.
Každý tím nakoniec potrebuje viac než chat completions — vlastný graf ComfyUI, fine-tune alebo jednorazovú GPU úlohu. Hypereal to vystavuje cez ten istý kľúč, tie isté logy, tie isté rozpočty.
Serverless GPU passthrough
Prineste si vlastný RunPod handler a volajte ho ako POST /v1/gpu/{slug}. My riešime autentifikáciu, meranie, retry a účet. Vy píšete handler.
Workflow ComfyUI ako API
Nahrajte akýkoľvek JSON workflow ComfyUI. Dáme vám verzovaný HTTP endpoint s typovanými vstupmi a výstupmi, účtovaný za každý beh. Už žiadne vkladanie grafov do Slacku.
Knižnica ComfyUI
Rastúci katalóg predpripravených workflow ComfyUI — obnova tváre, produktová fotografia, filmový upscale — volajte ich ako ktorýkoľvek iný model.
LoRA a úložisko assetov
Súkromné, verzované úložisko pre LoRA, checkpointy, embeddingy a referenčné obrázky. Odkazujte na ne pomocou handle z ľubovoľného workflow alebo generovania.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Čísla, ktoré zverejňujeme. Nie screenshoty v obchodnej prezentácii.
Live status stránka, transparentná latencia a história incidentov, ktorú si môžete prečítať bez toho, aby ste sa nás najprv pýtali.
Transparentná latencia
Rolling p50 a p95 pre každý gateway endpoint podľa regiónu.
História uptime
Uptime za posledných 30/90 dní, bez marketingovej matematiky. Číslo je číslo.
Prestaňte spúšťať 8 dashboardov dodávateľov.
Jeden API kľúč, jedna faktúra, jedno miesto, kde vidíte, čo sa deje. Spustíte to za menej než päť minút.

