Enterprise AI Gateway + Compute Platform
Yksi avain. Jokainen malli, jokainen GPU, jokainen ComfyUI-työnkulku. Mukana kustannukset, auditointi ja luotettavuus, joista CFO ja CTO jo kysyivät.
Tuotannossa käytössä tiimeillä, jotka julkaisevat kuva-, video-, ääni- ja chat-ominaisuuksia miljoonille loppukäyttäjille.
Tiedät kulusi ennen kuin lasku saapuu.
Jokainen gateway-pyyntö hinnoitellaan, kohdistetaan ja kirjataan reaaliajassa. Koontinäkymät per mallille, kuukausiennusteet ja budjettirajat — valmiina heti, ilman Datadog-koontinäkymää.
Kustannuskoontinäkymä
Päivittäinen kulutrendi, erittely per malli, 10 kalleinta pyyntöä. Näkymä, jota CFO oikeasti pyysi.
Kulujen ennuste
Jäljellä olevan kulutuksen ennuste kuukauden loppuun asti, jotta näet ylitykset viikkoja ennen kuin ne osuvat kortillesi.
Budjettihälytykset
Kuukausikatto per avain. Sähköpostit 80 % ja 100 % kohdalla sekä jäähdyttely, jotta sinua ei spämätä. Valinnainen automaattinen keskeytys pysäyttää karanneet loopit välittömästi.
Allekirjoitetut webhookit
HMAC-allekirjoitetut tapahtumat kulukynnyksille, avaimen luontiin, avaimen peruutukseen ja generoinnin epäonnistumiseen. Kytke ne PagerDutyyn, Slackiin tai omaan pääkirjaasi.
Katkokset tapahtuvat. Käyttäjiesi ei pitäisi huomata niitä.
Usean palveluntarjoajan failover, aluekohtainen varasijastus ja intentioon perustuva reititys muuttavat hauraan yhden toimittajan riippuvuuden redundantiksi, itsekorjautuvaksi kerrokseksi.
Usean palveluntarjoajan failover
Määritettävät aikakatkaisut ja yrityskäytäntö per avain. 5xx-virheessä tai aikakatkaisussa liikenne siirtyy läpinäkyvästi ketjun seuraavalle palveluntarjoajalle.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Älykäs reititys
Kerro meille tarkoitus — nopea chat, syvä päättely, kuvan muokkaus, pitkän tekstin tiivistys — niin valitsemme edullisimman sopivan palveluntarjoajan. Kiinnitä tarkka malli, kun tarvitset sitä.
Aluekohtainen varasijastus
Jos palveluntarjoajan US-East-alue heikkenee, yritämme US-Westin kautta ja sitten EU:n kautta ennen kuin pyyntö epäonnistuu. Aluesidonnaisuus on määritettävissä per avain.
Per avain hallittavat kontrollit, jotka läpäisevät tietoturvakatselmuksen.
Rajatut avaimet, tarkat nopeusrajat, IP-sallitut listat, muuttumaton auditointiloki ja CSV-vienti. Suunniteltu kysymyksiin, joita sekä CTO että auditoija kysyvät.
API-avaimen rajaus
Salli/estä mallit per avain, IP-sallittu lista sekä päivittäiset ja tuntikohtaiset kulukatot. Kierrätä ilman uudelleenasennusta.
Nopeusrajat per avain, per malli
RPM- ja TPM-rajat avaimelle ja mallille. Staging-avain ei voi vahingossa tyhjentää productionin kiintiötä.
Muuttumaton auditointiloki
Jokainen luotu avain, muuttunut rajaus, siirretty budjetti tai peruutus kirjataan tekijän, IP:n ja aikaleiman kanssa. SOC2-perustaso oletuksena.
Haettavat lokit + CSV-vienti
Suodata pyyntölokeja endpointin, mallin, tilan, viiveen ja avaimen mukaan. Yhdellä klikkauksella CSV taloushallinnolle, complianceen tai jälkipuintiin.
Compliance-asema
- TLS 1.2+ päästä päähän. Avaimet hashataan levossa, eikä niitä koskaan lokiteta selväkielisinä.
- Vuokrakohtainen avain- ja budjettieristys. Ei tietovuotoa eri vuokrien välillä.
- Määritettävä lokien säilytys. Poista pyynnön rungot tarvittaessa erittäin herkistä työkuormista.
- EU- ja US-reititys saatavilla pyynnöstä sijaintisidonnaisiin käyttöönottoihin.
- SOC2-kontrollit laajuudessa vuodelle 2026. Ota yhteyttä, jos tarvitset nykyisen kirjeen auditoijaltamme.
Suoraan OpenAI SDK:lle. Vaihda vain yksi base URL.
Hypereal tukee OpenAI Chat Completionsia, Imagesiä, Responsesia ja Anthropic Messagesia. Säilytä SDK:si, promptisi, tool-määrittelysi ja uudelleenyrityksesi — vaihda base URL ja API-avain, ja julkaise.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Tuetut endpointit
- POST /v1/chat/completions — OpenAI-yhteensopiva
- POST /v1/messages — Anthropic-yhteensopiva
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI-yhteensopiva
- POST /v1/videos/generate — Hypereal-video-API
- POST /v1/comfy/{slug} — ComfyUI-työnkulku API:na
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Mallit ovat vasta alku: laskenta ensiluokkaisena API:na.
Jokainen tiimi tarvitsee lopulta enemmän kuin chat completionsit — oman ComfyUI-graafin, fine-tunen, kertaluonteisen GPU-työn. Hypereal tuo nämä saman avaimen, samojen lokien ja saman budjetin taakse.
Serverless GPU Passthrough
Tuo oma RunPod handlerisi ja kutsu sitä POST /v1/gpu/{slug} -rajapinnalla. Me hoidamme autentikoinnin, mittauksen, uudelleenyritykset ja laskun. Sinä kirjoitat handlerin.
ComfyUI-työnkulku API:na
Lataa mikä tahansa ComfyUI-työnkulun JSON. Saat versionoidun HTTP-endpointin tyypitetyillä syötteillä ja ulostuloilla, laskutus per ajo. Slackiin ei enää tarvitse liittää graafeja.
ComfyUI-kirjasto
Kasvava kokoelma valmiita ComfyUI-työnkulkuja — kasvojen palautus, tuotekuva, elokuvamainen upscaling — kutsu niitä kuten mitä tahansa muuta mallia.
LoRA- ja asset-repositorio
Yksityinen, versioitu tallennus LoRA:ille, checkpointeille, embeddingeille ja referenssikuville. Viittaa niihin handlella mistä tahansa työnkulusta tai generoinnista.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Numerot, jotka julkaisemme. Eivät myyntikansion kuvakaappaukset.
Reaaliaikainen tilasivu, läpinäkyvä viive ja historiatiedot häiriöistä, jotka voit lukea kysymättä meiltä ensin.
Läpinäkyvä viive
Rullaavat p50- ja p95-arvot jokaiselle gateway-endpointille alueittain.
Käytettävyyshistoria
Jäljellä oleva 30/90 päivän käytettävyys, ei markkinointikikkaa. Luku on luku.
Lopeta 8 toimittajan dashboardien pyörittäminen.
Yksi API-avain, yksi lasku, yksi paikka nähdä mitä tapahtuu. Käytössä alle viidessä minuutissa.

