Hypereal Platform

Enterprise AI Gateway + Compute Platform

Yksi avain. Jokainen malli, jokainen GPU, jokainen ComfyUI-työnkulku. Mukana kustannukset, auditointi ja luotettavuus, joista CFO ja CTO jo kysyivät.

Hae API-avain Ota yhteyttä myyntiin

Tuotannossa käytössä tiimeillä, jotka julkaisevat kuva-, video-, ääni- ja chat-ominaisuuksia miljoonille loppukäyttäjille.

Kustannukset ja kulutus

Tiedät kulusi ennen kuin lasku saapuu.

Jokainen gateway-pyyntö hinnoitellaan, kohdistetaan ja kirjataan reaaliajassa. Koontinäkymät per mallille, kuukausiennusteet ja budjettirajat — valmiina heti, ilman Datadog-koontinäkymää.

Kustannuskoontinäkymä

Päivittäinen kulutrendi, erittely per malli, 10 kalleinta pyyntöä. Näkymä, jota CFO oikeasti pyysi.

Kulujen ennuste

Jäljellä olevan kulutuksen ennuste kuukauden loppuun asti, jotta näet ylitykset viikkoja ennen kuin ne osuvat kortillesi.

Budjettihälytykset

Kuukausikatto per avain. Sähköpostit 80 % ja 100 % kohdalla sekä jäähdyttely, jotta sinua ei spämätä. Valinnainen automaattinen keskeytys pysäyttää karanneet loopit välittömästi.

Allekirjoitetut webhookit

HMAC-allekirjoitetut tapahtumat kulukynnyksille, avaimen luontiin, avaimen peruutukseen ja generoinnin epäonnistumiseen. Kytke ne PagerDutyyn, Slackiin tai omaan pääkirjaasi.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Luotettavuus

Katkokset tapahtuvat. Käyttäjiesi ei pitäisi huomata niitä.

Usean palveluntarjoajan failover, aluekohtainen varasijastus ja intentioon perustuva reititys muuttavat hauraan yhden toimittajan riippuvuuden redundantiksi, itsekorjautuvaksi kerrokseksi.

Usean palveluntarjoajan failover

Määritettävät aikakatkaisut ja yrityskäytäntö per avain. 5xx-virheessä tai aikakatkaisussa liikenne siirtyy läpinäkyvästi ketjun seuraavalle palveluntarjoajalle.

Esimerkkivaraketju

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Pyyntösi ei koskaan näe epäonnistunutta siirtymää. Viivebudjetti valvotaan päästä päähän.

Älykäs reititys

Kerro meille tarkoitus — nopea chat, syvä päättely, kuvan muokkaus, pitkän tekstin tiivistys — niin valitsemme edullisimman sopivan palveluntarjoajan. Kiinnitä tarkka malli, kun tarvitset sitä.

Aluekohtainen varasijastus

Jos palveluntarjoajan US-East-alue heikkenee, yritämme US-Westin kautta ja sitten EU:n kautta ennen kuin pyyntö epäonnistuu. Aluesidonnaisuus on määritettävissä per avain.

Hallinta ja turvallisuus

Per avain hallittavat kontrollit, jotka läpäisevät tietoturvakatselmuksen.

Rajatut avaimet, tarkat nopeusrajat, IP-sallitut listat, muuttumaton auditointiloki ja CSV-vienti. Suunniteltu kysymyksiin, joita sekä CTO että auditoija kysyvät.

API-avaimen rajaus

Salli/estä mallit per avain, IP-sallittu lista sekä päivittäiset ja tuntikohtaiset kulukatot. Kierrätä ilman uudelleenasennusta.

Nopeusrajat per avain, per malli

RPM- ja TPM-rajat avaimelle ja mallille. Staging-avain ei voi vahingossa tyhjentää productionin kiintiötä.

Muuttumaton auditointiloki

Jokainen luotu avain, muuttunut rajaus, siirretty budjetti tai peruutus kirjataan tekijän, IP:n ja aikaleiman kanssa. SOC2-perustaso oletuksena.

Haettavat lokit + CSV-vienti

Suodata pyyntölokeja endpointin, mallin, tilan, viiveen ja avaimen mukaan. Yhdellä klikkauksella CSV taloushallinnolle, complianceen tai jälkipuintiin.

Compliance-asema

TLS 1.2+ päästä päähän. Avaimet hashataan levossa, eikä niitä koskaan lokiteta selväkielisinä.
Vuokrakohtainen avain- ja budjettieristys. Ei tietovuotoa eri vuokrien välillä.
Määritettävä lokien säilytys. Poista pyynnön rungot tarvittaessa erittäin herkistä työkuormista.
EU- ja US-reititys saatavilla pyynnöstä sijaintisidonnaisiin käyttöönottoihin.
SOC2-kontrollit laajuudessa vuodelle 2026. Ota yhteyttä, jos tarvitset nykyisen kirjeen auditoijaltamme.

Yhteensopivuus

Suoraan OpenAI SDK:lle. Vaihda vain yksi base URL.

Hypereal tukee OpenAI Chat Completionsia, Imagesiä, Responsesia ja Anthropic Messagesia. Säilytä SDK:si, promptisi, tool-määrittelysi ja uudelleenyrityksesi — vaihda base URL ja API-avain, ja julkaise.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Tuetut endpointit

POST /v1/chat/completions — OpenAI-yhteensopiva
POST /v1/messages — Anthropic-yhteensopiva
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — OpenAI-yhteensopiva
POST /v1/videos/generate — Hypereal-video-API
POST /v1/comfy/{slug} — ComfyUI-työnkulku API:na
POST /v1/gpu/{slug} — Serverless GPU passthrough

Laskenta

Mallit ovat vasta alku: laskenta ensiluokkaisena API:na.

Jokainen tiimi tarvitsee lopulta enemmän kuin chat completionsit — oman ComfyUI-graafin, fine-tunen, kertaluonteisen GPU-työn. Hypereal tuo nämä saman avaimen, samojen lokien ja saman budjetin taakse.

Serverless GPU Passthrough

Tuo oma RunPod handlerisi ja kutsu sitä POST /v1/gpu/{slug} -rajapinnalla. Me hoidamme autentikoinnin, mittauksen, uudelleenyritykset ja laskun. Sinä kirjoitat handlerin.

ComfyUI-työnkulku API:na

Lataa mikä tahansa ComfyUI-työnkulun JSON. Saat versionoidun HTTP-endpointin tyypitetyillä syötteillä ja ulostuloilla, laskutus per ajo. Slackiin ei enää tarvitse liittää graafeja.

ComfyUI-kirjasto

Kasvava kokoelma valmiita ComfyUI-työnkulkuja — kasvojen palautus, tuotekuva, elokuvamainen upscaling — kutsu niitä kuten mitä tahansa muuta mallia.

LoRA- ja asset-repositorio

Yksityinen, versioitu tallennus LoRA:ille, checkpointeille, embeddingeille ja referenssikuville. Viittaa niihin handlella mistä tahansa työnkulusta tai generoinnista.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Tila ja luottamus

Numerot, jotka julkaisemme. Eivät myyntikansion kuvakaappaukset.

Reaaliaikainen tilasivu, läpinäkyvä viive ja historiatiedot häiriöistä, jotka voit lukea kysymättä meiltä ensin.

Julkinen tilasivu

Reaaliaikainen tilanne per endpoint ja häiriöaikajana.

Näytä tilasivu

Läpinäkyvä viive

Rullaavat p50- ja p95-arvot jokaiselle gateway-endpointille alueittain.

Käytettävyyshistoria

Jäljellä oleva 30/90 päivän käytettävyys, ei markkinointikikkaa. Luku on luku.

Lopeta 8 toimittajan dashboardien pyörittäminen.

Yksi API-avain, yksi lasku, yksi paikka nähdä mitä tapahtuu. Käytössä alle viidessä minuutissa.

Hanki API-avain Ota yhteyttä myyntiin Lue dokumentaatio

Enterprise AI Gateway + Compute Platform

Yksi avain. Jokainen malli, jokainen GPU, jokainen ComfyUI-työnkulku. Mukana kustannukset, auditointi ja luotettavuus, joista CFO ja CTO jo kysyivät.

Tuotannossa käytössä tiimeillä, jotka julkaisevat kuva-, video-, ääni- ja chat-ominaisuuksia miljoonille loppukäyttäjille.

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });