Hypereal-platformen

Enterprise AI Gateway + Compute Platform

Én nøgle. Hver model, hver GPU, hver ComfyUI-workflow. Med den pris, audit og pålidelighed, som din CFO og CTO allerede har spurgt om.

Få en API-nøgle Tal med salg

Brugt i produktion af teams, der leverer image-, video-, voice- og chatfunktioner til millioner af slutbrugere.

Omkostninger og forbrug

Ved, hvad du bruger, før fakturaen lander.

Hver gateway-anmodning prissættes, tilskrives og logges i realtid. Dashboards pr. model, månedlige prognoser og budgetværn — lige fra starten, ingen Datadog-dashboard påkrævet.

Omkostningsdashboard

Daglig forbrugstrend, opdeling pr. model, top 10 dyreste anmodninger. Den visning, din CFO faktisk bad om.

Forbrugsprognose

Det løbende burn rate fremskrives til månedens udgang, så du kan se overskridelser uger, før de rammer dit kort.

Budgetadvarsler

Månedligt loft pr. nøgle. E-mails ved 80 % og 100 % med en cooldown, så du ikke bliver spammet. Valgfri automatisk pause stopper løbske loops helt.

Signerede webhooks

HMAC-signerede events for forbrugstærskler, nøgle oprettet, nøgle tilbagekaldt, generering mislykkedes. Kobl dem til PagerDuty, Slack eller din egen hovedbog.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Pålidelighed

Driftsforstyrrelser sker. Dine brugere bør ikke bemærke det.

Failover på tværs af flere udbydere, regional fallback og intent-aware routing gør en skrøbelig afhængighed af én leverandør til et redundant, selvhelende lag.

Failover på tværs af flere udbydere

Konfigurerbare timeouts og retry-politik pr. nøgle. Ved 5xx eller timeout flyttes trafikken transparent til den næste udbyder i kæden.

Eksempel på fallback-kæde

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Din anmodning ser aldrig det fejlede hop. Latensbudget håndhæves ende-til-ende.

Smart routing

Fortæl os intenten — hurtig chat, dyb ræsonnering, billedredigering, lang opsummering — og vi vælger den billigste kvalificerede udbyder. Fastlås en præcis model, når du har brug for det.

Regional fallback

Hvis en udbyders US-East-region er forringet, prøver vi US-West og derefter EU, før anmodningen fejler. Region-limning kan konfigureres pr. nøgle.

Governance og sikkerhed

Kontroller pr. nøgle, der består en sikkerhedsreview.

Afgrænsede nøgler, granulære rategrænser, IP-allowlister, uforanderlig audit-log og CSV-export. Designet til de spørgsmål, både din CTO og din revisor vil stille.

API-nøgle-afgrænsning

Tillad/afvis pr. nøgle på modeller, IP-allowlist, daglige og timevise forbrugslåg. Roter uden at redeploye.

Rategrænser pr. nøgle, pr. model

RPM- og TPM-grænser afgrænset til nøglen og modellen. En staging-nøgle kan ikke ved et uheld tømme prod's kvote.

Uforanderlig audit-log

Hver oprettet nøgle, ændret afgrænsning, flyttet budget eller tilbagekaldelse registreres med aktør, IP og tidsstempel. SOC2-baseline som standard.

Søgbare logs + CSV-export

Filtrér requestlogs efter endpoint, model, status, latenstid, nøgle. CSV med ét klik til finans, compliance eller post-mortem.

Compliance-status

TLS 1.2+ ende-til-ende. Nøgler hashed i hvile, aldrig logget i klartekst.
Isolering af nøgle + budget pr. tenant. Ingen krydstenant-data-lækage.
Konfigurerbar logopbevaring. Drop request bodies efter behov for workloads med høj følsomhed.
EU- og US-routing tilgængelig efter anmodning for deployment med krav til datalagring.
SOC2-kontroller i scope for 2026. Kontakt os, hvis du har brug for et aktuelt brev fra vores revisor.

Kompatibilitet

Drop-in til OpenAI SDK'et. Skift én base-URL.

Hypereal taler OpenAI Chat Completions, Images, Responses og Anthropic Messages. Behold dit SDK, dine prompts, dine tool-definitions, dine retries — skift base-URL og API-nøglen, ship.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Understøttede endpoints

POST /v1/chat/completions — OpenAI-kompatibel
POST /v1/messages — Anthropic-kompatibel
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — OpenAI-kompatibel
POST /v1/videos/generate — Hypereal video API
POST /v1/comfy/{slug} — ComfyUI workflow som API
POST /v1/gpu/{slug} — Serverless GPU passthrough

Compute

Udover modeller: compute som en førsteklasses API.

Hvert team får før eller siden brug for mere end chat completions — en custom ComfyUI-graf, en fine-tune, et engangs GPU-job. Hypereal eksponerer det bag samme nøgle, de samme logs, de samme budgetter.

Serverless GPU Passthrough

Bring din egen RunPod-handler og kald den som POST /v1/gpu/{slug}. Vi håndterer auth, afregning, retries og regningen. Du skriver handleren.

ComfyUI Workflow som API

Upload enhver ComfyUI-workflow JSON. Vi giver dig et versionsstyret HTTP-endpoint med typed inputs og outputs, afregnet pr. kørsel. Slut med at indsætte grafer i Slack.

ComfyUI-bibliotek

Et voksende katalog af færdigbyggede ComfyUI-workflows — face restore, produktfoto, cinematic upscale — kald dem som enhver anden model.

LoRA- og asset-repo

Privat, versionsstyret lagring til LoRA'er, checkpoints, embeddings og referencebilleder. Referér til dem via handle fra ethvert workflow eller generering.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Status og tillid

Tal, vi offentliggør. Ikke screenshots i en salgspitch.

Live status-side, transparent latenstid og en incident-historik, du kan læse uden at spørge os først.

Offentlig status-side

Live status pr. endpoint og incident-tidslinje.

Se status-side

Transparent latenstid

Rullende p50 og p95 for hvert gateway-endpoint, pr. region.

Oppetidshistorik

Rullende 30/90-dages oppetid, ingen marketing-matematik. Tallet er tallet.

Stop med at køre 8 vendor-dashboards.

Én API-nøgle, én regning, ét sted at se, hvad der sker. Kom i gang på under fem minutter.

Få en API-nøgle Tal med salg Læs dokumentationen

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });