Enterprise AI Gateway + Compute Platform
Én nøgle. Hver model, hver GPU, hver ComfyUI-workflow. Med den pris, audit og pålidelighed, som din CFO og CTO allerede har spurgt om.
Brugt i produktion af teams, der leverer image-, video-, voice- og chatfunktioner til millioner af slutbrugere.
Ved, hvad du bruger, før fakturaen lander.
Hver gateway-anmodning prissættes, tilskrives og logges i realtid. Dashboards pr. model, månedlige prognoser og budgetværn — lige fra starten, ingen Datadog-dashboard påkrævet.
Omkostningsdashboard
Daglig forbrugstrend, opdeling pr. model, top 10 dyreste anmodninger. Den visning, din CFO faktisk bad om.
Forbrugsprognose
Det løbende burn rate fremskrives til månedens udgang, så du kan se overskridelser uger, før de rammer dit kort.
Budgetadvarsler
Månedligt loft pr. nøgle. E-mails ved 80 % og 100 % med en cooldown, så du ikke bliver spammet. Valgfri automatisk pause stopper løbske loops helt.
Signerede webhooks
HMAC-signerede events for forbrugstærskler, nøgle oprettet, nøgle tilbagekaldt, generering mislykkedes. Kobl dem til PagerDuty, Slack eller din egen hovedbog.
Driftsforstyrrelser sker. Dine brugere bør ikke bemærke det.
Failover på tværs af flere udbydere, regional fallback og intent-aware routing gør en skrøbelig afhængighed af én leverandør til et redundant, selvhelende lag.
Failover på tværs af flere udbydere
Konfigurerbare timeouts og retry-politik pr. nøgle. Ved 5xx eller timeout flyttes trafikken transparent til den næste udbyder i kæden.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Smart routing
Fortæl os intenten — hurtig chat, dyb ræsonnering, billedredigering, lang opsummering — og vi vælger den billigste kvalificerede udbyder. Fastlås en præcis model, når du har brug for det.
Regional fallback
Hvis en udbyders US-East-region er forringet, prøver vi US-West og derefter EU, før anmodningen fejler. Region-limning kan konfigureres pr. nøgle.
Kontroller pr. nøgle, der består en sikkerhedsreview.
Afgrænsede nøgler, granulære rategrænser, IP-allowlister, uforanderlig audit-log og CSV-export. Designet til de spørgsmål, både din CTO og din revisor vil stille.
API-nøgle-afgrænsning
Tillad/afvis pr. nøgle på modeller, IP-allowlist, daglige og timevise forbrugslåg. Roter uden at redeploye.
Rategrænser pr. nøgle, pr. model
RPM- og TPM-grænser afgrænset til nøglen og modellen. En staging-nøgle kan ikke ved et uheld tømme prod's kvote.
Uforanderlig audit-log
Hver oprettet nøgle, ændret afgrænsning, flyttet budget eller tilbagekaldelse registreres med aktør, IP og tidsstempel. SOC2-baseline som standard.
Søgbare logs + CSV-export
Filtrér requestlogs efter endpoint, model, status, latenstid, nøgle. CSV med ét klik til finans, compliance eller post-mortem.
Compliance-status
- TLS 1.2+ ende-til-ende. Nøgler hashed i hvile, aldrig logget i klartekst.
- Isolering af nøgle + budget pr. tenant. Ingen krydstenant-data-lækage.
- Konfigurerbar logopbevaring. Drop request bodies efter behov for workloads med høj følsomhed.
- EU- og US-routing tilgængelig efter anmodning for deployment med krav til datalagring.
- SOC2-kontroller i scope for 2026. Kontakt os, hvis du har brug for et aktuelt brev fra vores revisor.
Drop-in til OpenAI SDK'et. Skift én base-URL.
Hypereal taler OpenAI Chat Completions, Images, Responses og Anthropic Messages. Behold dit SDK, dine prompts, dine tool-definitions, dine retries — skift base-URL og API-nøglen, ship.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Understøttede endpoints
- POST /v1/chat/completions — OpenAI-kompatibel
- POST /v1/messages — Anthropic-kompatibel
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-kompatibel
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow som API
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Udover modeller: compute som en førsteklasses API.
Hvert team får før eller siden brug for mere end chat completions — en custom ComfyUI-graf, en fine-tune, et engangs GPU-job. Hypereal eksponerer det bag samme nøgle, de samme logs, de samme budgetter.
Serverless GPU Passthrough
Bring din egen RunPod-handler og kald den som POST /v1/gpu/{slug}. Vi håndterer auth, afregning, retries og regningen. Du skriver handleren.
ComfyUI Workflow som API
Upload enhver ComfyUI-workflow JSON. Vi giver dig et versionsstyret HTTP-endpoint med typed inputs og outputs, afregnet pr. kørsel. Slut med at indsætte grafer i Slack.
ComfyUI-bibliotek
Et voksende katalog af færdigbyggede ComfyUI-workflows — face restore, produktfoto, cinematic upscale — kald dem som enhver anden model.
LoRA- og asset-repo
Privat, versionsstyret lagring til LoRA'er, checkpoints, embeddings og referencebilleder. Referér til dem via handle fra ethvert workflow eller generering.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Tal, vi offentliggør. Ikke screenshots i en salgspitch.
Live status-side, transparent latenstid og en incident-historik, du kan læse uden at spørge os først.
Transparent latenstid
Rullende p50 og p95 for hvert gateway-endpoint, pr. region.
Oppetidshistorik
Rullende 30/90-dages oppetid, ingen marketing-matematik. Tallet er tallet.
Stop med at køre 8 vendor-dashboards.
Én API-nøgle, én regning, ét sted at se, hvad der sker. Kom i gang på under fem minutter.

