Enterprise AI Gateway + Platformă de compute
O singură cheie. Fiecare model, fiecare GPU, fiecare workflow ComfyUI. Cu costul, auditul și fiabilitatea despre care CFO-ul și CTO-ul dvs. au întrebat deja.
Folosit în producție de echipe care livrează funcționalități de imagine, video, voce și chat către milioane de utilizatori finali.
Știți ce cheltuiți înainte să ajungă factura.
Fiecare cerere gateway este tarifată, atribuită și înregistrată în timp real. Tablouri de bord pe model, previziuni lunare și garduri de protecție bugetare — gata din start, fără să fie necesar un tablou de bord Datadog.
Tablou de bord costuri
Tendința cheltuielilor zilnice, defalcare pe model, top 10 cele mai costisitoare cereri. Vederea pe care CFO-ul chiar a cerut-o.
Previziune a cheltuielilor
Rata de consum din perioada recentă proiectată până la finalul lunii, ca să vedeți depășirile cu săptămâni înainte să ajungă pe card.
Alerte bugetare
Plafon lunar per cheie. Emailuri la 80% și 100%, cu cooldown, ca să nu fiți bombardat cu spam. Pauza automată opțională oprește complet buclele scăpate de sub control.
Webhook-uri semnate
Evenimente semnate HMAC pentru praguri de cheltuieli, cheie creată, cheie revocată, generare eșuată. Integrați-le cu PagerDuty, Slack sau propriul registru.
Se întâmplă întreruperi. Utilizatorii dvs. nu ar trebui să observe.
Failover multi-provider, rezervă regională și rutare bazată pe intenție transformă o dependență fragilă de un singur furnizor într-un strat redundant, cu autoremediere.
Failover multi-provider
Timeout-uri și politici de retry configurabile per cheie. La 5xx sau timeout, traficul este redirecționat transparent către următorul provider din lanț.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Rutare inteligentă
Spuneți-ne intenția — chat rapid, raționament profund, editare imagine, sumarizare pe termen lung — și alegem cel mai ieftin provider calificat. Blocați un model exact când aveți nevoie.
Rezervă regională
Dacă regiunea US-East a unui provider este degradată, încercăm US-West, apoi EU, înainte de a respinge cererea. Persistența pe regiune este configurabilă per cheie.
Controale per cheie care trec de o analiză de securitate.
Chei scoped, limite de rată granulare, allowlist-uri IP, jurnal de audit imuabil și export CSV. Conceput pentru întrebările pe care le vor pune și CTO-ul, și auditorul.
Scopare cheie API
Allow/deny per cheie pentru modele, allowlist IP, plafoane zilnice și orare de cheltuieli. Rotați fără redeploy.
Limite de rată per cheie, per model
Limite RPM și TPM definite pentru cheie și model. O cheie de staging nu poate consuma accidental cota de producție.
Jurnal de audit imuabil
Fiecare cheie creată, schimbare de scope, mutare de buget sau revocare este înregistrată cu actor, IP și timestamp. Bazat implicit pe SOC2.
Jurnale căutabile + export CSV
Filtrați jurnalele de cereri după endpoint, model, status, latență, cheie. CSV cu un clic pentru finanțe, conformitate sau post-mortem.
Postură de conformitate
- TLS 1.2+ end-to-end. Cheile sunt hashuite la stocare și nu sunt niciodată înregistrate în text clar.
- Izolare per tenant pentru cheie + buget. Nicio scurgere de date între tenanturi.
- Păstrare configurabilă a jurnalelor. Eliminați la cerere body-urile cererilor pentru workload-uri cu sensibilitate ridicată.
- Rutare EU și US disponibilă la cerere pentru implementări sensibile la rezidența datelor.
- Controale SOC2 în scop pentru 2026. Contactați-ne dacă aveți nevoie de o scrisoare actuală de la auditorul nostru.
Drop-in pentru SDK-ul OpenAI. Schimbați un singur base URL.
Hypereal vorbește OpenAI Chat Completions, Images, Responses și Anthropic Messages. Păstrați SDK-ul, prompturile, definițiile de tool, retry-urile — schimbați base URL-ul și cheia API, apoi livrați.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Endpointuri acceptate
- POST /v1/chat/completions — compatibil OpenAI
- POST /v1/messages — compatibil Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — compatibil OpenAI
- POST /v1/videos/generate — API video Hypereal
- POST /v1/comfy/{slug} — workflow ComfyUI ca API
- POST /v1/gpu/{slug} — passthrough GPU serverless
Dincolo de modele: compute ca API de primă clasă.
Fiecare echipă ajunge să aibă nevoie de mai mult decât chat completions — un graph ComfyUI personalizat, un fine-tune, o sarcină GPU unică. Hypereal le expune pe toate prin aceeași cheie, aceleași jurnale, aceleași bugete.
Passthrough GPU serverless
Folosți propriul handler RunPod și apelați-l ca POST /v1/gpu/{slug}. Noi gestionăm autentificarea, metering-ul, retry-urile și factura. Dvs. scrieți handlerul.
Workflow ComfyUI ca API
Încărcați orice JSON de workflow ComfyUI. Vă oferim un endpoint HTTP versionat, cu inputuri și outputuri tipizate, tarifat per rulare. Gata cu lipirea graph-urilor în Slack.
Bibliotecă ComfyUI
Un catalog în creștere de workflow-uri ComfyUI preconstruite — restaurare față, product shot, upscale cinematic — apelați-le ca pe orice alt model.
Repo de LoRA și asset-uri
Stocare privată, versionată pentru LoRA-uri, checkpoint-uri, embedding-uri și imagini de referință. Referiți-le prin handle din orice workflow sau generare.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Numerele pe care le publicăm. Nu capturi de ecran într-un deck de vânzări.
Pagină de status live, latență transparentă și un istoric de incidente pe care îl puteți citi fără să ne întrebați mai întâi.
Latență transparentă
p50 și p95 în rolling pentru fiecare endpoint gateway, pe regiuni.
Istoric uptime
Uptime pe ultimele 30/90 de zile, fără matematică de marketing. Cifra este cifra.
Nu mai rulați 8 tablou de borduri de furnizori.
O cheie API, o factură, un singur loc în care vedeți ce se întâmplă. Porniți în mai puțin de cinci minute.

