Hypereal Platform

Enterprise AI Gateway + Compute Platform

Én nøkkel. Hver modell, hver GPU, hver ComfyUI-workflow. Med kostnadene, revisjonen og påliteligheten økonomidirektøren og teknologidirektøren deres allerede har spurt om.

Hent en API-nøkkel Snakk med salg

Brukt i produksjon av team som leverer bilde-, video-, tale- og chat-funksjoner til millioner av sluttbrukere.

Kostnader og forbruk

Vit hva du bruker før fakturaen kommer.

Hver gateway-forespørsel prises, tilskrives og logges i sanntid. Dashbord per modell, månedlige prognoser og budsjettgrenser — rett ut av boksen, ingen Datadog-dashbord nødvendig.

Kostnadsdashbord

Daglig forbrukstrend, fordeling per modell, topp 10 dyreste forespørsler. Visningen CFO-en din faktisk ba om.

Forbruksprognose

Rullerende forbruksrate projisert til månedsslutt, så du kan se overskridelser uker før de treffer kortet ditt.

Budsjettvarsler

Månedsgrense per nøkkel. E-poster ved 80 % og 100 % med en nedkjølingsperiode, så du ikke blir spammet. Valgfri automatisk pause stopper løpske løkker helt.

Signerte webhooks

HMAC-signerte hendelser for forbruksterskler, nøkkel opprettet, nøkkel tilbakekalt, generering mislyktes. Koble dem til PagerDuty, Slack eller din egen ledger.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Pålitelighet

Driftsavbrudd skjer. Brukerne dine bør ikke merke det.

Failover på tvers av flere tilbydere, regional fallback og intensjonsbevisst ruting gjør en skjør avhengighet av én leverandør om til et redundant, selvhelbredende lag.

Failover med flere tilbydere

Konfigurerbare tidsavbrudd og ny prøve-policy per nøkkel. Ved 5xx eller timeout rutes trafikken sømløst videre til neste leverandør i kjeden.

Eksempel på fallback-kjede

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Forespørselen din ser aldri det feilede hoppet. Latensbudsjett håndheves ende til ende.

Smart ruting

Fortell oss intensjonen — rask chat, dyp resonnering, bilde-redigering, lang oppsummering — og vi velger den billigste kvalifiserte leverandøren. Fest en eksakt modell når du trenger det.

Regional fallback

Hvis en leverandørs US-East-region er degradert, prøver vi US-West, deretter EU, før forespørselen feiler. Regionsticking kan konfigureres per nøkkel.

Styring og sikkerhet

Kontroller per nøkkel som består en sikkerhetsgjennomgang.

Avgrensede nøkler, granulære rategrenser, IP-allowlister, uforanderlig revisjonslogg og CSV-eksport. Utformet for spørsmålene både CTO-en din og revisoren din vil stille.

API-nøkkel-skoping

Tillat/avvis per nøkkel på modeller, IP-allowliste, daglige og timevise forbruksgrenser. Roter uten å redistribuere.

Rategrenser per nøkkel, per modell

RPM- og TPM-grenser avgrenset til nøkkelen og modellen. En staging-nøkkel kan ikke ved et uhell tømme prod-kvoten.

Uforanderlig revisjonslogg

Hver opprettet nøkkel, endring i omfang, flyttet budsjett eller tilbakekalling logges med aktør, IP og tidsstempel. SOC2-baseline som standard.

Søkbare logger + CSV-eksport

Filtrer forespørselslogger etter endepunkt, modell, status, latens, nøkkel. CSV med ett klikk for økonomi, samsvar eller post-mortem.

Samsvarsprofil

TLS 1.2+ ende til ende. Nøkler hashet i hvile, aldri logget i klartekst.
Isolering av nøkkel + budsjett per tenant. Ingen datalekkasje mellom tenants.
Konfigurerbar loggbevaring. Slå av forespørselsinnhold ved behov for høysensitive arbeidslaster.
Ruting i EU og USA tilgjengelig på forespørsel for distribusjoner med krav til dataresidens.
SOC2-kontroller i scope for 2026. Ta kontakt hvis du trenger et oppdatert brev fra vår revisor.

Kompatibilitet

Plug and play for OpenAI SDK-en. Bytt bare én base-URL.

Hypereal snakker OpenAI Chat Completions, Images, Responses og Anthropic Messages. Behold SDK-en, promptene, verktøydefinisjonene og retry-logikken — bytt base-URL og API-nøkkelen, og kjør.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Støttede endepunkter

POST /v1/chat/completions — OpenAI-kompatibel
POST /v1/messages — Anthropic-kompatibel
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — OpenAI-kompatibel
POST /v1/videos/generate — Hypereal video API
POST /v1/comfy/{slug} — ComfyUI workflow som API
POST /v1/gpu/{slug} — Serverless GPU-gjennomgang

Beregning

Mer enn modeller: beregning som et førsteklasses API.

Alle team trenger før eller siden mer enn chat-completions — en tilpasset ComfyUI-graf, en fine-tune, en engangs GPU-jobb. Hypereal eksponerer dette bak samme nøkkel, samme logger, samme budsjetter.

Serverless GPU-gjennomgang

Ta med din egen RunPod-handler og kall den som POST /v1/gpu/{slug}. Vi håndterer autentisering, måling, retries og regningen. Du skriver handleren.

ComfyUI-workflow som API

Last opp hvilken som helst ComfyUI-workflow-JSON. Vi gir deg et versjonert HTTP-endepunkt med typede inputs og outputs, fakturert per kjøring. Slutt på å lime inn grafer i Slack.

ComfyUI-bibliotek

En voksende katalog med forhåndsbygde ComfyUI-workflows — ansiktsrestaurering, produktbilde, filmisk oppskalering — kall dem som enhver annen modell.

LoRA- og ressursarkiv

Privat, versjonsstyrt lagring for LoRA-er, checkpoints, embeddings og referansebilder. Referer til dem med handle fra enhver workflow eller generering.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Status og tillit

Tall vi publiserer. Ikke skjermbilder i en salgspresentasjon.

Live status-side, transparent latens og en hendelseshistorikk du kan lese uten å spørre oss først.

Offentlig status-side

Live status og hendelsestidslinje per endepunkt.

Se status-siden

Transparent latens

Rullerende p50 og p95 for hvert gateway-endepunkt, per region.

Oppetidshistorikk

Rullerende oppetid over 30/90 dager, uten markedsføringsmagi. Tallet er tallet.

Slutt å kjøre 8 leverandør-dashbord.

Én API-nøkkel, én regning, ett sted å se hva som skjer. Kom i gang på under fem minutter.

Få en API-nøkkel Snakk med salg Les dokumentasjonen

Enterprise AI Gateway + Compute Platform

Én nøkkel. Hver modell, hver GPU, hver ComfyUI-workflow. Med kostnadene, revisjonen og påliteligheten økonomidirektøren og teknologidirektøren deres allerede har spurt om.

Brukt i produksjon av team som leverer bilde-, video-, tale- og chat-funksjoner til millioner av sluttbrukere.

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });