Enterprise AI Gateway + Compute Platform
Jedan ključ. Svi modeli, svi GPU-ovi, svi ComfyUI workflowi. Uz troškove, audit i pouzdanost o kojima su vaš CFO i CTO već pitali.
U produkciji ga koriste timovi koji isporučuju značajke za slike, video, glas i chat milijunima krajnjih korisnika.
Znajte koliko trošite prije nego što račun stigne.
Svaki gateway zahtjev se cijeni, pripisuje i bilježi u stvarnom vremenu. Nadzorne ploče po modelu, mjesečne prognoze i zaštitne granice proračuna — odmah dostupno, bez potrebe za Datadog nadzornom pločom.
Nadzorna ploča troškova
Dnevni trend potrošnje, raščlamba po modelu, 10 najskupljih zahtjeva. Pogled koji je vaš CFO zapravo tražio.
Prognoza potrošnje
Projekcija trenutne stope trošenja do kraja mjeseca, kako biste mogli vidjeti prekoračenja tjednima prije nego što se pojave na vašoj kartici.
Upozorenja o budžetu
Mjesečni limit po ključu. E-mailovi na 80% i 100% uz cooldown, kako vas ne bi zatrpali porukama. Opcionalna automatska pauza zaustavlja nekontrolirane petlje u trenutku.
Potpisani webhookovi
Događaji potpisani HMAC-om za pragove potrošnje, kreiranje ključa, opoziv ključa, neuspjelo generiranje. Povežite ih s PagerDutyjem, Slackom ili vlastitim knjigovodstvom.
Prekidi se događaju. Vaši korisnici to ne bi trebali primijetiti.
Failover kroz više pružatelja, regionalni fallback i usmjeravanje prema namjeri pretvaraju krhku ovisnost o jednom dobavljaču u redundantni, samoiscjeljujući sloj.
Failover kroz više pružatelja
Konfigurabilni timeouti i politika ponavljanja po ključu. Kod 5xx grešaka ili isteka vremena, promet se transparentno preusmjerava na sljedećeg pružatelja u lancu.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Pametno usmjeravanje
Recite nam namjeru — brzi chat, duboko rezoniranje, uređivanje slike, sažimanje dugog teksta — i mi biramo najjeftinijeg kvalificiranog pružatelja. Pinajte točan model kada vam treba.
Regionalni fallback
Ako je US-East regija nekog pružatelja degradirana, pokušavamo US-West, zatim EU, prije nego što zahtjev propadne. Zadržavanje regije konfigurabilno je po ključu.
Kontrole po ključu koje prolaze sigurnosni pregled.
Ključevi s opsegom, granularna ograničenja brzine, IP allowlist, nepromjenjivi audit log i CSV izvoz. Dizajnirano za pitanja koja će postaviti i vaš CTO i vaš revizor.
Opseg API ključa
Dozvoli/zabrani po ključu za modele, IP allowlist, dnevni i satni budžetski limiti. Rotirajte bez ponovnog deploya.
Ograničenja brzine po ključu i modelu
RPM i TPM ograničenja definirana za ključ i model. Staging ključ ne može slučajno potrošiti produkcijsku kvotu.
Nepromjenjivi audit log
Svaki kreirani ključ, promjena opsega, premještanje budžeta ili opoziv bilježi se zajedno s akterom, IP adresom i vremenskom oznakom. SOC2-osnovica prema zadanim postavkama.
Pretraživi logovi + CSV izvoz
Filtrirajte logove zahtjeva po endpointu, modelu, statusu, latenciji, ključu. CSV jednim klikom za financije, usklađenost ili post-mortem.
Usklađenost
- TLS 1.2+ od početka do kraja. Ključevi su hashirani u mirovanju, nikad se ne bilježe u običnom tekstu.
- Izolacija ključa i budžeta po tenantu. Nema curenja podataka između tenanata.
- Konfigurabilno zadržavanje logova. Po potrebi odbacite tijela zahtjeva za visokosenzitivna opterećenja.
- EU i US usmjeravanje dostupno je na zahtjev za implementacije osjetljive na rezidentnost podataka.
- SOC2 kontrole u opsegu za 2026. Javite se ako trebate trenutačno pismo našeg revizora.
Uključuje se izravno u OpenAI SDK. Zamijenite samo jedan base URL.
Hypereal podržava OpenAI Chat Completions, Images, Responses i Anthropic Messages. Zadržite svoj SDK, svoje promptove, definicije alata i ponavljanja — promijenite base URL i API ključ, pa objavite.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Podržani endpointi
- POST /v1/chat/completions — kompatibilno s OpenAI
- POST /v1/messages — kompatibilno s Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — kompatibilno s OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow kao API
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Iznad modela: računalni resursi kao API prve klase.
Svaki tim na kraju treba više od chat completions — prilagođeni ComfyUI graf, fine-tune ili jednokratni GPU zadatak. Hypereal to izlaže kroz isti ključ, iste logove i iste budžete.
Serverless GPU passthrough
Donesite vlastiti RunPod handler i pozovite ga kao POST /v1/gpu/{slug}. Mi rješavamo autentikaciju, mjerenje, ponovne pokušaje i račun. Vi pišete handler.
ComfyUI workflow kao API
Učitajte bilo koji ComfyUI workflow JSON. Dobivate verzionirani HTTP endpoint s tipiziranim ulazima i izlazima, naplatu po pokretanju. Nema više lijepljenja grafova u Slack.
ComfyUI knjižnica
Rastući katalog unaprijed izrađenih ComfyUI workflowa — restauracija lica, prikaz proizvoda, filmski upscale — koristite ih kao bilo koji drugi model.
LoRA i spremište resursa
Privatna, verzionirana pohrana za LoRA modele, checkpointove, embeddinge i referentne slike. Referencirajte ih pomoću handlea iz bilo kojeg workflowa ili generiranja.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Brojke koje objavljujemo. Ne screenshotovi u prodajnom decku.
Javna statusna stranica, transparentna latencija i povijest incidenata koju možete pročitati bez da nas prvo pitate.
Javna statusna stranica
Status uživo po endpointu i vremenska crta incidenata.
Pogledajte statusnu stranicuTransparentna latencija
Kontinuirani p50 i p95 za svaki gateway endpoint, po regiji.
Povijest dostupnosti
Posljednjih 30/90 dana dostupnosti, bez marketinške matematike. Broj je broj.
Prestani koristiti 8 nadzornih ploča dobavljača.
Jedan API ključ, jedan račun, jedno mjesto za pregled što se događa. Krenite u manje od pet minuta.

