Enterprise AI Gateway + Compute Platform
Egy kulcs. Minden modell, minden GPU, minden ComfyUI workflow. A költségekkel, auditálással és megbízhatósággal, amelyekre a CFO és a CTO már rákérdezett.
Éles környezetben használják olyan csapatok, amelyek képgenerálási, videó, hang és chat funkciókat szállítanak milliós végfelhasználói bázisnak.
Tudd meg, mennyit költesz, mielőtt megérkezik a számla.
Minden gateway-kérés ára, hozzárendelése és naplózása valós időben történik. Modellenkénti irányítópultok, havi előrejelzések és költségkeret-őrzők — alapból, Datadog dashboard nélkül.
Költség irányítópult
Napi kiadási trend, modellenkénti bontás, 10 legdrágább kérés. Az a nézet, amit a CFO-d ténylegesen kért.
Kiadási előrejelzés
A futó kiadási ráta hónap végére vetítve, hogy hetekre előre lásd a túlköltést, mielőtt elérné a kártyádat.
Költségkeret-riasztások
Kulcsonkénti havi limit. E-mailek 80% és 100% mellett, lehűlési idővel, hogy ne árasszanak el a levelek. Az opcionális automatikus szüneteltetés azonnal megállítja a kicsúszó ciklusokat.
Aláírt webhookok
HMAC-aláírt események kiadási küszöbökhöz, kulcs létrehozásához, kulcs visszavonásához, generálási hibához. Kösd be őket PagerDuty-ba, Slackbe vagy a saját ledgeredbe.
Leállások előfordulnak. A felhasználóidnak nem kell észrevenniük.
A több szolgáltatós failover, a regionális fallback és a szándékérzékeny útválasztás egy törékeny egyetlen szállítótól függő megoldást redundáns, önjavító réteggé alakít.
Több szolgáltatós failover
Konfigurálható kulcsonkénti timeoutok és újrapróbálkozási szabályok. 5xx hiba vagy timeout esetén a forgalom átláthatóan a lánc következő szolgáltatójára vált.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Intelligens útválasztás
Mondd el a szándékot — gyors chat, mély érvelés, kép szerkesztés, hosszú összefoglalás — és mi kiválasztjuk a legolcsóbb megfelelő szolgáltatót. Ha kell, rögzíts pontos modellt.
Regionális fallback
Ha egy szolgáltató US-East régiója romlik, megpróbáljuk a US-Westet, majd az EU-t, mielőtt elutasítanánk a kérését. A régióhoz kötöttség kulcsonként konfigurálható.
Kulcsonkénti vezérlők, amelyek megfelelnek egy biztonsági felülvizsgálatnak.
Csoportosított kulcsok, finomhangolt sebességkorlátok, IP allowlist, változtathatatlan auditnapló és CSV export. Úgy terveztük, hogy megválaszolja azokat a kérdéseket, amelyeket a CTO-d és az auditorod is fel fog tenni.
API-kulcs scoping
Kulcsonkénti engedélyezés/tiltás modellekre, IP allowlist, napi és óránkénti kiadási plafonok. Forgatás újratelepítés nélkül.
Kulcsonkénti, modellenkénti sebességkorlátok
RPM és TPM limitek a kulcsra és a modellre szűkítve. Egy staging kulcs nem tudja véletlenül lemeríteni a prod kvótáját.
Változtathatatlan auditnapló
Minden létrehozott kulcs, scoping-változás, költségkeret-módosítás vagy visszavonás rögzítve van az actorral, IP-vel és időbélyeggel együtt. Alapból SOC2-szintű.
Kereshető naplók + CSV export
Szűrd a kérésnaplókat endpoint, modell, státusz, késleltetés, kulcs szerint. Egykattintásos CSV pénzügynek, megfelelőséghez vagy post-mortemhez.
Megfelelőségi pozíció
- TLS 1.2+ végponttól végpontig. A kulcsok nyugalmi állapotban hashelve vannak, és soha nem kerülnek naplózásra tiszta szövegben.
- Tenantenkénti kulcs- és költségkeret-izoláció. Nincs kereszt-tenant adatkisülés.
- Konfigurálható naplómegőrzés. Igény szerint töröld a kérés törzsét a nagy érzékenységű munkaterhelésekhez.
- EU és US útválasztás kérésre elérhető adatrezidencia-érzékeny telepítésekhez.
- A SOC2-vezérlők 2026-ra vannak a hatókörben. Keress meg, ha szükséged van az auditorunktól származó aktuális levélre.
Az OpenAI SDK-hoz drop-in. Cserélj le egyetlen base URL-t.
A Hypereal támogatja az OpenAI Chat Completions, Images, Responses és Anthropic Messages API-kat. Tartsd meg az SDK-dat, a promptjaidat, az eszközdefinícióidat, az újrapróbálkozásaidat — csak a base URL-t és az API-kulcsot cseréld le, és mehet is.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Támogatott endpointok
- POST /v1/chat/completions — OpenAI-kompatibilis
- POST /v1/messages — Anthropic-kompatibilis
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-kompatibilis
- POST /v1/videos/generate — Hypereal videó API
- POST /v1/comfy/{slug} — ComfyUI workflow mint API
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Túl a modelleken: számítás első osztályú API-ként.
Minden csapatnak előbb-utóbb többre van szüksége, mint chat completionsre — egy egyedi ComfyUI graphra, egy fine-tune-ra, egy egyszeri GPU feladatra. A Hypereal ezeket ugyanazon kulcs mögött, ugyanazon naplókban, ugyanazon költségkeretekkel teszi elérhetővé.
Serverless GPU passthrough
Hozd a saját RunPod handlert, és hívd meg a POST /v1/gpu/{slug} végponton. Mi intézzük az azonosítást, a mérőórázást, az újrapróbálkozásokat és a számlát. Te írod a handlert.
ComfyUI workflow mint API
Tölts fel bármilyen ComfyUI workflow JSON-t. Adunk neked egy verziózott HTTP endpointot típusos bemenetekkel és kimenetekkel, futásonkénti díjazással. Nem kell többé graphokat másolgatni Slackbe.
ComfyUI könyvtár
Egy növekvő katalógus előre elkészített ComfyUI workflow-kból — arcrestaurálás, termékfotó, filmes felskálázás — hívd őket, mint bármely más modellt.
LoRA és asset tár
Privát, verziózott tároló LoRA-k, checkpointok, embeddingek és referencia képek számára. Hivatkozz rájuk handle-lel bármely workflowból vagy generálásból.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Számok, amelyeket közzéteszünk. Nem screenshotok egy sales deckben.
Élő státuszoldal, átlátható késleltetés és egy incidenselőzmény, amit előzetes kérés nélkül is elolvashatsz.
Átlátható késleltetés
Gördülő p50 és p95 minden gateway endpointnál, régiónként.
Üzemidő előzmény
Az elmúlt 30/90 nap üzemideje, marketinges matek nélkül. A szám az a szám.
Hagyd abba 8 szolgáltató irányítópultjának futtatását.
Egy API-kulcs, egy számla, egy hely, ahol látod, mi történik. Öt percen belül üzembe állhatsz.

