Enterprise AI Gateway + Compute Platform
Én nøkkel. Hver modell, hver GPU, hver ComfyUI-workflow. Med kostnadene, revisjonen og påliteligheten økonomidirektøren og teknologidirektøren deres allerede har spurt om.
Brukt i produksjon av team som leverer bilde-, video-, tale- og chat-funksjoner til millioner av sluttbrukere.
Vit hva du bruker før fakturaen kommer.
Hver gateway-forespørsel prises, tilskrives og logges i sanntid. Dashbord per modell, månedlige prognoser og budsjettgrenser — rett ut av boksen, ingen Datadog-dashbord nødvendig.
Kostnadsdashbord
Daglig forbrukstrend, fordeling per modell, topp 10 dyreste forespørsler. Visningen CFO-en din faktisk ba om.
Forbruksprognose
Rullerende forbruksrate projisert til månedsslutt, så du kan se overskridelser uker før de treffer kortet ditt.
Budsjettvarsler
Månedsgrense per nøkkel. E-poster ved 80 % og 100 % med en nedkjølingsperiode, så du ikke blir spammet. Valgfri automatisk pause stopper løpske løkker helt.
Signerte webhooks
HMAC-signerte hendelser for forbruksterskler, nøkkel opprettet, nøkkel tilbakekalt, generering mislyktes. Koble dem til PagerDuty, Slack eller din egen ledger.
Driftsavbrudd skjer. Brukerne dine bør ikke merke det.
Failover på tvers av flere tilbydere, regional fallback og intensjonsbevisst ruting gjør en skjør avhengighet av én leverandør om til et redundant, selvhelbredende lag.
Failover med flere tilbydere
Konfigurerbare tidsavbrudd og ny prøve-policy per nøkkel. Ved 5xx eller timeout rutes trafikken sømløst videre til neste leverandør i kjeden.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Smart ruting
Fortell oss intensjonen — rask chat, dyp resonnering, bilde-redigering, lang oppsummering — og vi velger den billigste kvalifiserte leverandøren. Fest en eksakt modell når du trenger det.
Regional fallback
Hvis en leverandørs US-East-region er degradert, prøver vi US-West, deretter EU, før forespørselen feiler. Regionsticking kan konfigureres per nøkkel.
Kontroller per nøkkel som består en sikkerhetsgjennomgang.
Avgrensede nøkler, granulære rategrenser, IP-allowlister, uforanderlig revisjonslogg og CSV-eksport. Utformet for spørsmålene både CTO-en din og revisoren din vil stille.
API-nøkkel-skoping
Tillat/avvis per nøkkel på modeller, IP-allowliste, daglige og timevise forbruksgrenser. Roter uten å redistribuere.
Rategrenser per nøkkel, per modell
RPM- og TPM-grenser avgrenset til nøkkelen og modellen. En staging-nøkkel kan ikke ved et uhell tømme prod-kvoten.
Uforanderlig revisjonslogg
Hver opprettet nøkkel, endring i omfang, flyttet budsjett eller tilbakekalling logges med aktør, IP og tidsstempel. SOC2-baseline som standard.
Søkbare logger + CSV-eksport
Filtrer forespørselslogger etter endepunkt, modell, status, latens, nøkkel. CSV med ett klikk for økonomi, samsvar eller post-mortem.
Samsvarsprofil
- TLS 1.2+ ende til ende. Nøkler hashet i hvile, aldri logget i klartekst.
- Isolering av nøkkel + budsjett per tenant. Ingen datalekkasje mellom tenants.
- Konfigurerbar loggbevaring. Slå av forespørselsinnhold ved behov for høysensitive arbeidslaster.
- Ruting i EU og USA tilgjengelig på forespørsel for distribusjoner med krav til dataresidens.
- SOC2-kontroller i scope for 2026. Ta kontakt hvis du trenger et oppdatert brev fra vår revisor.
Plug and play for OpenAI SDK-en. Bytt bare én base-URL.
Hypereal snakker OpenAI Chat Completions, Images, Responses og Anthropic Messages. Behold SDK-en, promptene, verktøydefinisjonene og retry-logikken — bytt base-URL og API-nøkkelen, og kjør.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Støttede endepunkter
- POST /v1/chat/completions — OpenAI-kompatibel
- POST /v1/messages — Anthropic-kompatibel
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-kompatibel
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow som API
- POST /v1/gpu/{slug} — Serverless GPU-gjennomgang
Mer enn modeller: beregning som et førsteklasses API.
Alle team trenger før eller siden mer enn chat-completions — en tilpasset ComfyUI-graf, en fine-tune, en engangs GPU-jobb. Hypereal eksponerer dette bak samme nøkkel, samme logger, samme budsjetter.
Serverless GPU-gjennomgang
Ta med din egen RunPod-handler og kall den som POST /v1/gpu/{slug}. Vi håndterer autentisering, måling, retries og regningen. Du skriver handleren.
ComfyUI-workflow som API
Last opp hvilken som helst ComfyUI-workflow-JSON. Vi gir deg et versjonert HTTP-endepunkt med typede inputs og outputs, fakturert per kjøring. Slutt på å lime inn grafer i Slack.
ComfyUI-bibliotek
En voksende katalog med forhåndsbygde ComfyUI-workflows — ansiktsrestaurering, produktbilde, filmisk oppskalering — kall dem som enhver annen modell.
LoRA- og ressursarkiv
Privat, versjonsstyrt lagring for LoRA-er, checkpoints, embeddings og referansebilder. Referer til dem med handle fra enhver workflow eller generering.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Tall vi publiserer. Ikke skjermbilder i en salgspresentasjon.
Live status-side, transparent latens og en hendelseshistorikk du kan lese uten å spørre oss først.
Transparent latens
Rullerende p50 og p95 for hvert gateway-endepunkt, per region.
Oppetidshistorikk
Rullerende oppetid over 30/90 dager, uten markedsføringsmagi. Tallet er tallet.
Slutt å kjøre 8 leverandør-dashbord.
Én API-nøkkel, én regning, ett sted å se hva som skjer. Kom i gang på under fem minutter.

