Enterprise AI Gateway + Compute Platforma
Vienas raktas. Kiekvienas modelis, kiekvienas GPU, kiekviena ComfyUI darbo eiga. Su kaina, auditu ir patikimumu, apie kuriuos jau klausė jūsų CFO ir CTO.
Naudojama gamyboje komandų, kurios milijonams galutinių naudotojų teikia vaizdų, vaizdo įrašų, balso ir pokalbių funkcijas.
Žinokite, kiek išleidžiate, dar prieš gaudami sąskaitą.
Kiekviena vartų užklausa įkainojama, priskiriama ir registruojama realiuoju laiku. Kiekvieno modelio valdymo skydeliai, mėnesio prognozės ir biudžeto apsaugos ribos — iš karto, nereikia Datadog valdymo skydelio.
Išlaidų valdymo skydelis
Dienos išlaidų tendencija, skirstymas pagal modelį, 10 brangiausių užklausų. Vaizdas, kurio iš tikrųjų paprašė jūsų CFO.
Išlaidų prognozė
Paskutinių dienų degimo tempas prognozuojamas iki mėnesio pabaigos, kad viršijimus matytumėte keliomis savaitėmis anksčiau, nei jie pasieks jūsų kortelę.
Biudžeto įspėjimai
Mėnesio riba kiekvienam raktui. Laiškai ties 80 % ir 100 % su užlaikymu, kad nebūtumėte užversti pranešimais. Pasirenkamas automatinis pristabdymas sustabdo nekontroliuojamas kilpas vietoje.
Pasirašyti Webhook
HMAC pasirašyti įvykiai išlaidų slenksčiams, sukurtiems raktams, atšauktiems raktams, nepavykusiam generavimui. Prijunkite juos prie PagerDuty, Slack arba savo apskaitos žurnalo.
Atsijungimai nutinka. Jūsų naudotojai to neturėtų pastebėti.
Kelių tiekėjų perjungimas, regioninis atsarginis maršrutizavimas ir pagal intenciją veikiantis nukreipimas paverčia trapų priklausymą nuo vieno tiekėjo redundantišku, savaime atsistatančiu sluoksniu.
Kelių tiekėjų perjungimas
Konfigūruojami laiko limitai ir bandymų kartojimo politika kiekvienam raktui. Įvykus 5xx arba viršijus laiką, srautas sklandžiai perkeliamas pas kitą tiekėją grandinėje.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Išmanusis nukreipimas
Pasakykite mums intenciją — greitas pokalbis, gilus samprotavimas, vaizdo redagavimas, ilgos formos santrauka — ir parinksime pigiausią tinkamą tiekėją. Užfiksuokite tikslų modelį, kai to reikia.
Regioninis atsarginis veikimas
Jei tiekėjo US-East regionas veikia prastai, bandome US-West, tada EU, ir tik po to atmetame užklausą. Regiono prieraišumas konfigūruojamas kiekvienam raktui.
Kiekvienam raktui skirtos valdymo priemonės, atitinkančios saugumo peržiūrą.
Ribotos apimties raktai, detalūs užklausų limitai, IP leidžiamųjų sąrašai, nekeičiamas audito žurnalas ir CSV eksportas. Sukurta atsižvelgiant į klausimus, kuriuos užduos ir jūsų CTO, ir auditorius.
API rakto apimtis
Kiekvienam raktui leisti/uždrausti modeliai, IP leidžiamasis sąrašas, dienos ir valandos išlaidų ribos. Atnaujinkite nereikalaudami diegimo iš naujo.
Kiekvienam raktui, kiekvienam modeliui skirti užklausų limitai
RPM ir TPM limitai, priskirti raktui ir modeliui. Testavimo raktas negali netyčia išnaudoti gamybinės aplinkos kvotos.
Nekeičiamas audito žurnalas
Kiekvienas sukurtas raktas, pakeista apimtis, perkelti biudžetai ar atšaukimas įrašomi kartu su veiksmą atlikusiu asmeniu, IP ir laiko žyma. Pagal nutylėjimą atitinka SOC2 bazinius reikalavimus.
Ieškomi žurnalai + CSV eksportas
Filtruokite užklausų žurnalus pagal galinį tašką, modelį, būseną, delsą, raktą. Vieno paspaudimo CSV finansams, atitikčiai ar post-mortem analizei.
Atitikties būsena
- TLS 1.2+ nuo galo iki galo. Raktai maišomi saugykloje, niekada neregistruojami atviru tekstu.
- Kiekvienam nuomininkui skirta rakto ir biudžeto izoliacija. Jokio duomenų nutekėjimo tarp nuomininkų.
- Konfigūruojamas žurnalų saugojimo laikas. Didelio jautrumo apkrovoms prireikus pašaliname užklausų turinį.
- ES ir JAV maršrutizavimas prieinamas pagal užklausą aplinkoms, kurioms svarbi duomenų rezidencija.
- SOC2 kontrolės įtrauktos į apimtį 2026 m. Susisiekite, jei jums reikia dabartinio mūsų auditoriaus rašto.
Iškart veikia su OpenAI SDK. Pakeiskite vieną bazinį URL.
Hypereal palaiko OpenAI Chat Completions, Images, Responses ir Anthropic Messages. Palikite savo SDK, užklausas, įrankių apibrėžtis, bandymų kartojimą — pakeiskite bazinį URL ir API raktą, ir diegkite.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Palaikomi galiniai taškai
- POST /v1/chat/completions — suderinama su OpenAI
- POST /v1/messages — suderinama su Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — suderinama su OpenAI
- POST /v1/videos/generate — Hypereal vaizdo įrašo API
- POST /v1/comfy/{slug} — ComfyUI darbo eiga kaip API
- POST /v1/gpu/{slug} — Serverless GPU perdavimas
Daugiau nei modeliai: skaičiavimai kaip pirmos klasės API.
Kiekvienai komandai galiausiai prireikia daugiau nei pokalbių generavimo — pasirinktinio ComfyUI grafiko, fine-tune ar vienkartinės GPU užduoties. Hypereal tai pateikia per tą patį raktą, tuos pačius žurnalus, tuos pačius biudžetus.
Serverless GPU perdavimas
Atsineškite savo RunPod handler ir kvieskite jį per POST /v1/gpu/{slug}. Mes pasirūpiname autentifikacija, apskaita, bandymų kartojimu ir sąskaita. Jūs rašote handler.
ComfyUI darbo eiga kaip API
Įkelkite bet kurį ComfyUI darbo eigos JSON. Suteikiame versijuotą HTTP galinį tašką su tipizuotais įvesties ir išvesties duomenimis, įkainojamą už kiekvieną paleidimą. Nebereikia įklijuoti grafikų į Slack.
ComfyUI biblioteka
Augantis iš anksto paruoštų ComfyUI darbo eigų katalogas — veido atkūrimas, produkto nuotrauka, kino lygio didinimas — kvieskite jas kaip bet kurį kitą modelį.
LoRA ir išteklių saugykla
Privati, versijuota LoRA, checkpointų, embeddingų ir pavyzdinių vaizdų saugykla. Nurodykite juos pagal identifikatorių iš bet kurios darbo eigos ar generavimo.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Skaičiai, kuriuos skelbiame. Ne ekrano kopijos pardavimų pristatyme.
Tiesioginė būsenos puslapio informacija, skaidri delsos statistika ir incidentų istorija, kurią galite perskaityti prieš klausdami mūsų.
Viešas būsenos puslapis
Tiesioginė kiekvieno galinio taško būsena ir incidentų laiko juosta.
Peržiūrėti būsenos puslapįSkaidri delsa
Slenkantys p50 ir p95 kiekvienam vartų galiniam taškui pagal regioną.
Veikimo istorija
Paskutinių 30/90 dienų veikimo laikas, be rinkodaros matematikos. Skaičius yra skaičius.
Nustokite naudoti 8 tiekėjų valdymo skydelius.
Vienas API raktas, viena sąskaita, viena vieta matyti, kas vyksta. Pradėkite per mažiau nei penkias minutes.

