Enterprise AI Gateway + Compute Platform
En nyckel. Varje modell, varje GPU, varje ComfyUI-arbetsflöde. Med den kostnad, granskning och tillförlitlighet som din CFO och CTO redan har frågat om.
Används i produktion av team som levererar funktioner för bild, video, röst och chatt till miljontals slutanvändare.
Vet vad du spenderar innan fakturan kommer.
Varje gateway-begäran prissätts, tillskrivs och loggas i realtid. Instrumentpaneler per modell, månatliga prognoser och budgetskydd finns direkt inbyggt — inget Datadog-dashboard krävs.
Kostnadsinstrumentpanel
Daglig utgiftstrend, uppdelning per modell, topp 10 dyraste begäranden. Vyn din CFO faktiskt bad om.
Utgiftsprognos
Bakåtblickande burn rate projicerad till månadsslut så att du kan se överskridanden veckor innan de når ditt kort.
Budgetaviseringar
Månatligt tak per nyckel. E-post vid 80 % och 100 % med en cooldown så att du inte spammas. Valfri automatisk paus stoppar skenande loopar direkt.
Signerade webhooks
HMAC-signerade event för utgiftströsklar, nyckel skapad, nyckel återkallad, generering misslyckades. Koppla dem till PagerDuty, Slack eller din egen liggare.
Avbrott händer. Dina användare ska inte märka det.
Failover mellan flera leverantörer, regional fallback och intentsmedveten routing förvandlar ett skört beroende av en enda leverantör till ett redundant, självläkande lager.
Failover mellan flera leverantörer
Konfigurerbara timeout- och retry-policyer per nyckel. Vid 5xx eller timeout flyttas trafiken transparent till nästa leverantör i kedjan.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Smart routing
Berätta för oss intentionen — snabb chatt, djup resonemang, bildredigering, lång sammanfattning — så väljer vi den billigaste kvalificerade leverantören. Lås en exakt modell när du behöver det.
Regional fallback
Om en leverantörs US-East-region är försämrad försöker vi US-West, sedan EU, innan begäran misslyckas. Regionlåsningsbeteende kan konfigureras per nyckel.
Kontroller per nyckel som klarar en säkerhetsgranskning.
Avgränsade nycklar, detaljerade hastighetsgränser, IP-allowlist, oföränderlig granskningslogg och CSV-export. Utformat för de frågor som både din CTO och din revisor kommer att ställa.
API-nyckelavgränsning
Tillåt/blockera per nyckel för modeller, IP-allowlist, dagliga och timvisa utgiftstak. Rotera utan att göra om driftsättningen.
Hastighetsgränser per nyckel, per modell
RPM- och TPM-gränser avgränsade till nyckeln och modellen. En staging-nyckel kan inte av misstag tömma prod:s kvot.
Oföränderlig granskningslogg
Varje nyckel som skapas, scope som ändras, budget som flyttas eller återkallas registreras med aktör, IP och tidsstämpel. SOC2-baslinje som standard.
Sökbara loggar + CSV-export
Filtrera begäransloggar efter endpoint, modell, status, latens, nyckel. CSV med ett klick för ekonomi, efterlevnad eller post-mortem.
Efterlevnadsnivå
- TLS 1.2+ från början till slut. Nycklar hashade i vila, loggas aldrig i klartext.
- Isolering av nyckel + budget per tenant. Ingen dataläcka mellan tenants.
- Konfigurerbar loggretention. Ta bort begärans bodies på begäran för arbetslaster med hög känslighet.
- EU- och US-routing tillgängligt på begäran för distributioner med krav på datalagringsplats.
- SOC2-kontroller omfattas från 2026. Hör av dig om du behöver ett aktuellt brev från vår revisor.
Drop-in för OpenAI SDK. Byt en base URL.
Hypereal pratar OpenAI Chat Completions, Images, Responses och Anthropic Messages. Behåll ditt SDK, dina prompts, dina verktygsdefinitioner, dina retries — ändra base URL och API-nyckeln, kör.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Stödda endpoints
- POST /v1/chat/completions — OpenAI-kompatibel
- POST /v1/messages — Anthropic-kompatibel
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-kompatibel
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI-arbetsflöde som API
- POST /v1/gpu/{slug} — Serverless GPU-pass-through
Mer än modeller: compute som ett förstaklassigt API.
Varje team behöver förr eller senare mer än chat completions — en anpassad ComfyUI-graf, en fine-tune, ett engångs-GPU-jobb. Hypereal exponerar det bakom samma nyckel, samma loggar, samma budgetar.
Serverless GPU-pass-through
Ta med din egen RunPod-handler och anropa den som POST /v1/gpu/{slug}. Vi hanterar autentisering, mätning, retries och fakturan. Du skriver handlern.
ComfyUI-arbetsflöde som API
Ladda upp valfri ComfyUI-workflow JSON. Vi ger dig en versionshanterad HTTP-endpoint med typade in- och utdata, debiterad per körning. Inget mer klistra in grafer i Slack.
ComfyUI-bibliotek
En växande katalog av förbyggda ComfyUI-arbetsflöden — face restore, produktbild, cinematic upscale — anropa dem som vilken annan modell som helst.
LoRA- och resursrepo
Privat, versionshanterad lagring för LoRAs, checkpoints, embeddings och referensbilder. Referera till dem med handle från valfritt arbetsflöde eller generering.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Siffror vi publicerar. Inte skärmbilder i en säljpresentation.
Live status-sida, transparent latens och en incidenthistorik du kan läsa utan att fråga oss först.
Transparent latens
Rullande p50 och p95 för varje gateway-endpoint, per region.
Historik för upptid
Rullande upptid över 30/90 dagar, ingen marknadsföringsmatematik. Siffran är siffran.
Sluta köra 8 leverantörs-instrumentpaneler.
En API-nyckel, en faktura, en plats att se vad som händer. Kom igång på under fem minuter.

