Enterprise AI Gateway + Compute Platform
Eén sleutel. Elk model, elke GPU, elke ComfyUI workflow. Met de kosten, audit en betrouwbaarheid waar uw CFO en CTO al naar vroegen.
Gebruikt in productie door teams die afbeelding-, video-, spraak- en chatfuncties leveren aan miljoenen eindgebruikers.
Weet wat u uitgeeft voordat de factuur arriveert.
Elk gateway-verzoek wordt in realtime geprijsd, toegeschreven en gelogd. Dashboards per model, maandelijkse prognoses en budgetbeveiligingen — direct beschikbaar, geen Datadog-dashboard vereist.
Kosten Dashboard
Dagelijkse uitgavetrend, uitsplitsing per model, top-10 duurste verzoeken. Het overzicht waar uw CFO daadwerkelijk om vroeg.
Uitgavenprognose
Voortschrijdende burn rate geprojecteerd tot het einde van de maand, zodat u overschrijdingen weken voordat ze uw kaart belasten kunt zien.
Budgetwaarschuwingen
Maandelijks maximum per sleutel. E-mails bij 80% en 100% met een afkoelperiode zodat u niet wordt gespamd. Optionele automatische pauze stopt onbeheerde lussen onmiddellijk.
Ondertekende Webhooks
HMAC-ondertekende gebeurtenissen voor uitgavendrempels, sleutel aangemaakt, sleutel ingetrokken, generatie mislukt. Koppel ze aan PagerDuty, Slack of uw eigen grootboek.
Storingen gebeuren. Uw gebruikers zouden het niet moeten merken.
Multi-provider failover, regionale fallback en intent-aware routing transformeren een fragiele single-vendor afhankelijkheid in een redundante, zelfherstellende laag.
Multi-Provider Failover
Configureerbare timeouts en herhalingsbeleid per sleutel. Bij 5xx of timeout wordt het verkeer transparant doorgestuurd naar de volgende provider in de keten.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Slimme routering
Vertel ons de intentie — snelle chat, diepgaande redenering, beeldbewerking, lange samenvatting — en wij kiezen de goedkoopste gekwalificeerde provider. Pin een exact model wanneer u dat nodig heeft.
Regionale terugval
Als de US-East-regio van een provider is gedegradeerd, proberen we US-West, dan de EU, voordat het verzoek mislukt. Regio-binding is configureerbaar per sleutel.
Per-sleutel controles die voldoen aan een beveiligingsbeoordeling.
Gescopeerde sleutels, gedetailleerde snelheidslimieten, IP-toegangslijsten, onveranderlijk auditlogboek en CSV-export. Ontworpen voor de vragen die zowel uw CTO als uw auditor zullen stellen.
API-sleutel scoping
Per-sleutel toestaan/weigeren op modellen, IP-toegangslijst, dagelijkse en uurlijkse uitgavenlimieten. Roteren zonder opnieuw te implementeren.
Per-sleutel, per-model snelheidslimieten
RPM- en TPM-limieten gescopeerd op de sleutel en het model. Een staging-sleutel kan niet per ongeluk het quotum van productie leegmaken.
Onveranderlijk auditlogboek
Elke aangemaakte sleutel, gewijzigde scope, verplaatst budget of intrekking wordt vastgelegd met actor, IP en tijdstempel. SOC2-basislijn standaard.
Doorzoekbare logboeken + CSV-export
Filter verzoeklogboeken op eindpunt, model, status, latentie, sleutel. Eén-klik CSV voor financiën, compliance of post-mortem.
Compliance-houding
- TLS 1.2+ end-to-end. Sleutels gehasht in rust, nooit in platte tekst gelogd.
- Per-tenant sleutel + budgetisolatie. Geen gegevenslekkage tussen tenants.
- Configureerbare logboekretentie. Verwijder verzoeklichamen op aanvraag voor workloads met hoge gevoeligheid.
- EU- en VS-routering beschikbaar op aanvraag voor implementaties die gevoelig zijn voor gegevenslocatie.
- SOC2-controles in scope voor 2026. Neem contact op als u een actuele brief van onze auditor nodig heeft.
Drop-in voor de OpenAI SDK. Wissel één basis-URL.
Hypereal spreekt OpenAI Chat Completions, Images, Responses en Anthropic Messages. Behoud uw SDK, uw prompts, uw tooldefinities, uw retries — wijzig de basis-URL en de API-sleutel, en verzend.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Ondersteunde eindpunten
- POST /v1/chat/completions — OpenAI-compatibel
- POST /v1/messages — Anthropic-compatibel
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-compatibel
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow als API
- POST /v1/gpu/{slug} — Serverloze GPU passthrough
Voorbij modellen: compute als een eersteklas API.
Elk team heeft uiteindelijk meer nodig dan chat-completions — een aangepaste ComfyUI-grafiek, een fine-tune, een eenmalige GPU-taak. Hypereal ontsluit deze achter dezelfde sleutel, dezelfde logs, dezelfde budgetten.
Serverloze GPU Passthrough
Breng uw eigen RunPod-handler mee en roep deze aan als POST /v1/gpu/{slug}. Wij regelen de authenticatie, meting, herhaalpogingen en de factuur. U schrijft de handler.
ComfyUI Workflow als API
Upload elke ComfyUI workflow JSON. Wij geven u een versieerd HTTP-eindpunt met getypeerde invoer en uitvoer, gefactureerd per uitvoering. Geen grafieken meer plakken in Slack.
ComfyUI Bibliotheek
Een groeiende catalogus van vooraf gebouwde ComfyUI-workflows — gezichtsherstel, productfoto, filmische upscale — roep ze aan zoals elk ander model.
LoRA & Asset Repo
Privé, versieerde opslag voor LoRA's, checkpoints, embeddings en referentieafbeeldingen. Verwijs ernaar met de handle vanuit elke workflow of generatie.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Cijfers die we publiceren. Geen screenshots in een salesdeck.
Live statuspagina, transparante latentie en een incidentgeschiedenis die u kunt lezen zonder ons eerst te vragen.
Transparante latentie
Voortschrijdende p50 en p95 voor elk gateway-eindpunt, per regio.
Uptime geschiedenis
Uptime van de afgelopen 30/90 dagen, geen marketingtrucs. Het getal is het getal.
Stop met het beheren van 8 leveranciersdashboards.
Eén API-sleutel, één factuur, één plek om te zien wat er gebeurt. Ga binnen vijf minuten aan de slag.

