Enterprise AI Gateway + Compute Platform
Üks võti. Iga mudel, iga GPU, iga ComfyUI töövoog. Kulude, auditi ja töökindlusega, mille kohta sinu CFO ja CTO juba küsisid.
Tootmises kasutusel meeskondade poolt, kes toovad miljonitele lõppkasutajatele pildi, video, hääle ja vestluse funktsioone.
Tea, mida kulutad, enne kui arve saabub.
Iga gateway päring on reaalajas hinnastatud, omistatud ja logitud. Mudelipõhised töölauad, kuuprognoosid ja eelarvepiirangud — kohe olemas, Datadogi töölauda pole vaja.
Kulukontrolli töölaud
Päevane kulu trend, jaotus mudelite lõikes, 10 kõige kallimat päringut. Vaade, mida sinu CFO tegelikult soovis.
Kulukulu prognoos
Jooksev kulumäär projitseeritakse kuu lõpuni, et näeksid ülekulusid nädalaid enne, kui need kaardini jõuavad.
Eelarveteated
Iga võtme kuupiirang. E-kirjad 80% ja 100% juures koos jahtumisajaga, et sind ei spämmita. Valikuline automaatne paus peatab jooksukõvera kohe.
Allkirjastatud webhookid
HMAC-allkirjastatud sündmused kulu lävede, võtme loomise, võtme tühistamise ja genereerimise nurjumise kohta. Ühenda need PagerDuty, Slacki või oma pearaamatuga.
Tõrked juhtuvad. Sinu kasutajad ei peaks seda märkama.
Mitme teenusepakkuja failover, regionaalne varuvariant ja intenti arvestav marsruutimine muudavad hapra ühe tarnija sõltuvuse redundantseks, iseparanevaks kihiks.
Mitme teenusepakkuja failover
Konfigureeritavad võtmepõhised timeout'id ja retry-poliitika. 5xx või timeout'i korral liigub liiklus läbipaistvalt ahela järgmise teenusepakkuja juurde.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Nutikas marsruutimine
Ütle meile eesmärk — kiire chat, sügav arutlus, pildi muutmine, pikk kokkuvõte — ja me valime odavaima sobiva teenusepakkuja. Vajadusel kinnita täpne mudel.
Piirkondlik varuvariant
Kui teenusepakkuja US-East piirkond on häiritud, proovime US-West'i, siis EU-d, enne kui päring ebaõnnestub. Piirkonna külge kinnitumine on võtme kaupa seadistatav.
Võtmepõhised kontrollid, mis läbivad turvakontrolli.
Piiratud võtmed, detailsed kiiruspiirangud, IP allowlist, muutumatu auditeerimislogi ja CSV eksport. Loodud küsimustele, mida küsivad nii sinu CTO kui ka audiitor.
API võtme ulatus
Võtmepõhine lubamine/keelamine mudelitele, IP allowlist, päevased ja tunnised kulu piirangud. Pööra võtmeid ilma deploy't tegemata.
Võtme- ja mudelipõhised kiiruspiirangud
RPM ja TPM piirangud, mis kehtivad võtmele ja mudelile. Staging-võti ei saa kogemata prod'i kvooti tühjaks tõmmata.
Muutumatu auditeerimislogi
Iga loodud võti, muudetud ulatus, teisaldatud eelarve või tühistamine logitakse koos tegija, IP ja ajatempliga. Vaikimisi SOC2-alus.
Otsitavad logid + CSV eksport
Filtreeri päringulogisid endpoint'i, mudeli, staatuse, latentsuse ja võtme järgi. Ühe klikiga CSV rahandusele, vastavusele või järelanalüüsiks.
Vastavusolek
- TLS 1.2+ otsast lõpuni. Võtmed on at rest räsi kujul, mitte kunagi plaintext'is logitud.
- Iga tenant'i võtme- ja eelarveisolatsioon. Andmeleket tenant'ite vahel ei ole.
- Konfigureeritav logide säilitamine. Eemalda päringu kehad nõudmisel kõrge tundlikkusega töökoormuste puhul.
- EU ja US marsruutimine on saadaval nõudmisel residentuuse suhtes tundlike kasutuste jaoks.
- SOC2 kontrollid on 2026. aastal ulatuses. Võta ühendust, kui vajad meie audiitori värsket kirja.
Otsevahetus OpenAI SDK jaoks. Vaheta vaid üks base URL.
Hypereal räägib OpenAI Chat Completions, Images, Responses ja Anthropic Messages API-t. Jäta alles oma SDK, promptid, tööriistade definitsioonid ja retry'd — vaheta base URL ja API võti, ning tarni.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Toetatud endpoint'id
- POST /v1/chat/completions — OpenAI-ga ühilduv
- POST /v1/messages — Anthropicuga ühilduv
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-ga ühilduv
- POST /v1/videos/generate — Hypereali video API
- POST /v1/comfy/{slug} — ComfyUI workflow API-na
- POST /v1/gpu/{slug} — Serverless GPU läbipääs
Rohkem kui mudelid: arvutusvõimsus kui esmaklassiline API.
Iga tiim vajab lõpuks enamat kui chat completions'i — kohandatud ComfyUI graafi, fine-tune'i või ühekordset GPU töötlust. Hypereal toob need sama võtme, samade logide ja samade eelarvete taha.
Serverless GPU läbipääs
Too oma RunPodi handler ja kutsu seda POST /v1/gpu/{slug} kaudu. Me haldame autentimist, mõõdistamist, retry'sid ja arvet. Sina kirjutad handler'i.
ComfyUI workflow API-na
Laadi üles ükskõik milline ComfyUI workflow JSON. Anname sulle versioonitud HTTP endpoint'i tüpiseeritud sisendite ja väljunditega, arveldatakse jooksu kaupa. Enam ei pea graafe Slacki kleepima.
ComfyUI teek
Kasvav valmistehtud ComfyUI workflow'de kataloog — näo taastamine, tootefoto, cinematic upscale — kasuta neid nagu iga teist mudelit.
LoRA ja varade hoidla
Privaatne, versioonitud salvestus LoRAde, checkpoint'ide, embedding'ute ja referentspiltide jaoks. Viita neile käepidemega mis tahes workflow's või genereerimisel.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Numbrid, mida avaldame. Mitte müügipakkumise ekraanipildid.
Reaalajas staatuse leht, läbipaistev latentsus ja intsidendiajalugu, mida saad lugeda ilma meilt küsimata.
Läbipaistev latentsus
Jooksev p50 ja p95 iga gateway endpoint'i kohta, piirkonna kaupa.
Kättesaadavuse ajalugu
Viimase 30/90 päeva kättesaadavus, ilma turundusmatemaatikata. Arv on arv.
Lõpeta 8 teenusepakkuja töölaudade haldamine.
Üks API võti, üks arve, üks koht, kus näha, mis toimub. Saa tööle vähem kui viie minutiga.

