Enterprise AI Gateway + Compute Platforma
Jeden klíč. Každý model, každé GPU, každý ComfyUI workflow. S náklady, auditem a spolehlivostí, na které se už ptali váš CFO i CTO.
Používají ji produkční týmy, které doručují funkce pro obrázky, video, hlas a chat milionům koncových uživatelů.
Vězte, za co utrácíte, ještě než dorazí faktura.
Každý požadavek přes gateway je naceněný, přiřazený a zalogovaný v reálném čase. Dashboardy podle modelu, měsíční predikce a rozpočtové pojistky — rovnou po zapnutí, bez nutnosti Datadog dashboardu.
Přehled nákladů
Denní trend útrat, rozpis podle modelu, top 10 nejdražších požadavků. Pohled, o který váš CFO opravdu požádal.
Predikce útrat
Odhad tempa čerpání do konce měsíce, abyste viděli překročení rozpočtu týdny předtím, než se projeví na kartě.
Upozornění na rozpočet
Měsíční limit na klíč. E-maily při 80 % a 100 % s cooldownem, takže vás to nespamuje. Volitelná automatická pauza okamžitě zastaví nekonečné smyčky.
Podepsané webhooks
Události podepsané HMAC pro prahy útrat, vytvoření klíče, zrušení klíče, neúspěšné generování. Napojte je na PagerDuty, Slack nebo vlastní účetní systém.
Výpadky se stávají. Vaši uživatelé to nesmí poznat.
Failover mezi více poskytovateli, regionální fallback a směrování podle záměru mění křehkou závislost na jediném dodavateli v redundantní, samoléčící vrstvu.
Failover mezi více poskytovateli
Konfigurovatelné timeouty a retry politika pro každý klíč. Při 5xx nebo timeoutu se provoz transparentně přepne na dalšího poskytovatele v řetězci.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Chytré směrování
Řekněte nám záměr — rychlý chat, hluboké uvažování, úprava obrázku, dlouhé shrnutí — a my vybereme nejlevnějšího kvalifikovaného poskytovatele. Když potřebujete, připněte přesný model.
Regionální fallback
Pokud je region US-East u poskytovatele degradovaný, zkusíme US-West a potom EU, než požadavek selže. Regionální stickiness lze nastavit pro každý klíč.
Ovládání na úrovni klíče, které projde bezpečnostním review.
Scopované klíče, jemnozrnný limit požadavků, IP allowlist, neměnný audit log a export do CSV. Navrženo pro otázky, které položí váš CTO i auditor.
Scopování API klíče
Allow/deny pro modely na úrovni klíče, IP allowlist, denní a hodinové stropy útrat. Rotujte bez redeploye.
Limit požadavků na úrovni klíče a modelu
Limity RPM a TPM navázané na klíč a model. Staging klíč omylem nevyčerpá produkční kvótu.
Neměnný audit log
Každé vytvoření klíče, změna scope, přesun rozpočtu nebo zrušení se zaznamená s aktérem, IP a časovým razítkem. Ve výchozím nastavení SOC2 baseline.
Prohledávatelné logy + export do CSV
Filtrujte logy požadavků podle endpointu, modelu, stavu, latence, klíče. CSV na jedno kliknutí pro finance, compliance nebo post-mortem.
Stav compliance
- TLS 1.2+ end-to-end. Klíče jsou hashované v klidu a nikdy se nelogují v plaintextu.
- Izolace klíčů a rozpočtu pro každého tenanta. Žádný únik dat mezi tenanty.
- Konfigurovatelná retence logů. Pro vysoce citlivé workloady lze na požádání zahazovat těla požadavků.
- Na požádání dostupné směrování přes EU a US pro nasazení citlivá na residency.
- SOC2 kontrolní opatření v rozsahu pro rok 2026. Ozvěte se, pokud potřebujete aktuální dopis od našeho auditora.
Drop-in pro OpenAI SDK. Stačí vyměnit jednu base URL.
Hypereal mluví OpenAI Chat Completions, Images, Responses a Anthropic Messages. Nechte si SDK, prompty, definice nástrojů i retry — změňte base URL a API klíč a vyrazte.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Podporované endpointy
- POST /v1/chat/completions — kompatibilní s OpenAI
- POST /v1/messages — kompatibilní s Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — kompatibilní s OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow jako API
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Více než modely: compute jako API první třídy.
Každý tým nakonec potřebuje víc než chat completions — vlastní ComfyUI graph, fine-tune nebo jednorázovou GPU úlohu. Hypereal to vystavuje přes stejný klíč, stejné logy a stejné rozpočty.
Serverless GPU passthrough
Přineste si vlastní RunPod handler a volejte ho přes POST /v1/gpu/{slug}. My řešíme auth, metering, retry a účet. Handler píšete vy.
ComfyUI workflow jako API
Nahrajte libovolný JSON workflow z ComfyUI. Dostanete verzovaný HTTP endpoint s typovanými vstupy a výstupy, účtovaný za běh. Žádné další posílání grafů do Slacku.
ComfyUI knihovna
Rostoucí katalog předpřipravených ComfyUI workflow — obnova obličeje, produktová fotka, filmový upscale — volejte je jako kterýkoli jiný model.
LoRA a asset repozitář
Soukromé verzované úložiště pro LoRA, checkpointy, embeddingy a referenční obrázky. Odkazujte na ně přes handle z libovolného workflow nebo generování.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Čísla, která zveřejňujeme. Ne screenshoty v prodejním decku.
Živá status stránka, transparentní latence a historie incidentů, kterou si můžete přečíst bez toho, abyste se nás nejdřív ptali.
Veřejná status stránka
Živý stav a incident timeline po jednotlivých endpoint ech.
Zobrazit status stránkuTransparentní latence
Průběžné p50 a p95 pro každý gateway endpoint, podle regionu.
Historie uptime
Uptime za posledních 30/90 dní, bez marketingové matematiky. Číslo je číslo.
Přestaňte spravovat 8 dashboardů dodavatelů.
Jeden API klíč, jedna faktura, jedno místo, kde uvidíte, co se děje. Zprovozněte to za méně než pět minut.

