Enterprise AI Gateway + Compute Platforma
Jedan ključ. Svaki model, svaki GPU, svaki ComfyUI workflow. Sa troškovima, revizijom i pouzdanošću o kojima su vaš CFO i CTO već pitali.
Koriste je produkcijski timovi koji isporučuju funkcije za sliku, video, glas i chat milionima krajnjih korisnika.
Znajte koliko trošite pre nego što stigne faktura.
Svaki gateway zahtev se ceni, pripisuje i evidentira u realnom vremenu. Kontrolne table po modelu, mesečne prognoze i zaštitne granice budžeta — odmah spremno, bez potrebe za Datadog kontrolnom tablom.
Kontrolna tabla troškova
Dnevni trend potrošnje, pregled po modelu, 10 najskupljih zahteva. Prikaz koji je vaš CFO zaista tražio.
Prognoza potrošnje
Nastavna stopa potrošnje projektovana do kraja meseca, tako da možete da vidite prekoračenja nedeljama pre nego što stignu na vašu karticu.
Upozorenja o budžetu
Mesečni limit po ključu. Emailovi na 80% i 100% uz cooldown, tako da vas ne spamujemo. Opcionalna automatska pauza odmah zaustavlja nekontrolisane petlje.
Potpisani webhookovi
Događaji potpisani HMAC-om za pragove potrošnje, kreiran ključ, opozvan ključ, neuspešno generisanje. Povežite ih sa PagerDuty, Slack-om ili sopstvenim knjigovodstvom.
Prekidi se dešavaju. Vaši korisnici ne bi trebalo to da primete.
Failover između više provajdera, rezervni regionalni fallback i usmeravanje zasnovano na nameri pretvaraju krhku zavisnost od jednog dobavljača u redundantni, samoisceljujući sloj.
Failover između više provajdera
Konfigurisani timeout-i i politika ponavljanja po ključu. U slučaju 5xx ili timeout-a, saobraćaj se transparentno prebacuje na sledećeg provajdera u lancu.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Pametno usmeravanje
Recite nam nameru — brz chat, duboko rezonovanje, izmena slike, duga sažimanja — i mi biramo najjeftinijeg kvalifikovanog provajdera. Precizno zakačite model kada vam je to potrebno.
Regionalni fallback
Ako je US-East region nekog provajdera degradiran, pokušavamo US-West, pa EU, pre nego što zahtev padne. Region-stickiness se može konfigurisati po ključu.
Kontrole po ključu koje prolaze bezbednosni pregled.
Ključevi sa opsegom, granularna ograničenja brzine, IP allowlist-e, nepromenljiv audit log i CSV izvoz. Dizajnirano za pitanja koja će i vaš CTO i vaš revizor postaviti.
Opseg API ključa
Allow/deny po ključu za modele, IP allowlist, dnevni i satni budžetski limiti. Rotirajte bez redeploy-a.
Ograničenja brzine po ključu, po modelu
RPM i TPM limiti definisani za ključ i model. Staging ključ ne može slučajno da potroši produkcijsku kvotu.
Nepromenljiv audit log
Svaki kreiran ključ, promenjen opseg, premešten budžet ili opoziv beleži se sa akterom, IP adresom i vremenom. SOC2 osnova podrazumevano.
Pretraživi logovi + CSV izvoz
Filtrirajte logove zahteva po endpoint-u, modelu, statusu, latenciji, ključu. CSV jednim klikom za finansije, usklađenost ili post-mortem.
Pozicija usklađenosti
- TLS 1.2+ od početka do kraja. Ključevi heširani u mirovanju, nikada se ne loguju u plain text-u.
- Izolacija ključa + budžeta po tenant-u. Bez curenja podataka između tenant-a.
- Konfigurisano zadržavanje logova. Po potrebi uklonite tela zahteva za workload-e visoke osetljivosti.
- EU i US usmeravanje dostupno na zahtev za deployment-e osetljive na rezidentnost podataka.
- SOC2 kontrole su u opsegu za 2026. Javite se ako vam je potrebno trenutno pismo našeg revizora.
Drop-in za OpenAI SDK. Zamenite samo jedan base URL.
Hypereal govori OpenAI Chat Completions, Images, Responses i Anthropic Messages. Zadržite svoj SDK, svoje promptove, definicije alata i retry-je — promenite base URL i API ključ, i isporučite.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Podržani endpoint-i
- POST /v1/chat/completions — kompatibilno sa OpenAI
- POST /v1/messages — kompatibilno sa Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — kompatibilno sa OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — ComfyUI workflow kao API
- POST /v1/gpu/{slug} — Serverless GPU passthrough
Više od modela: compute kao API prve klase.
Svaki tim na kraju treba više od chat completions — prilagođeni ComfyUI graf, fine-tune ili jednokratni GPU posao. Hypereal to izlaže iza istog ključa, istih logova i istih budžeta.
Serverless GPU Passthrough
Ponesite svoj RunPod handler i pozovite ga kao POST /v1/gpu/{slug}. Mi rešavamo autentifikaciju, merenje, retry-je i račun. Vi pišete handler.
ComfyUI Workflow kao API
Otpremite bilo koji ComfyUI workflow JSON. Dobićete verzionisani HTTP endpoint sa tipiziranim ulazima i izlazima, naplaćivan po pokretanju. Nema više lepljenja grafova u Slack.
ComfyUI biblioteka
Rastući katalog unapred izgrađenih ComfyUI workflow-a — restauracija lica, product shot, cinematic upscale — pozovite ih kao bilo koji drugi model.
LoRA i repozitorijum resursa
Privatno, verzionisano skladište za LoRA modele, checkpoint-ove, embedding-e i referentne slike. Referencirajte ih preko handle-a iz bilo kog workflow-a ili generisanja.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Brojevi koje objavljujemo. Ne screenshot-ovi u prodajnom deck-u.
Live stranica statusa, transparentna latencija i istorija incidenata koju možete pročitati bez da nas prvo pitate.
Javna stranica statusa
Status po endpoint-u u realnom vremenu i vremenska linija incidenata.
Prikaži stranicu statusaTransparentna latencija
Pokretni p50 i p95 za svaki gateway endpoint, po regionu.
Istorija uptime-a
Nastavnih 30/90 dana uptime-a, bez marketinške matematike. Broj je broj.
Prestanite da pratite 8 vendor kontrolnih tabli.
Jedan API ključ, jedan račun, jedno mesto za pregled onoga što se dešava. Pokrenite sve za manje od pet minuta.

