Platforma Hypereal

Enterprise AI Gateway + Platformă de compute

O singură cheie. Fiecare model, fiecare GPU, fiecare workflow ComfyUI. Cu costul, auditul și fiabilitatea despre care CFO-ul și CTO-ul dvs. au întrebat deja.

Obțineți o cheie API Discutați cu vânzările

Folosit în producție de echipe care livrează funcționalități de imagine, video, voce și chat către milioane de utilizatori finali.

Costuri și cheltuieli

Știți ce cheltuiți înainte să ajungă factura.

Fiecare cerere gateway este tarifată, atribuită și înregistrată în timp real. Tablouri de bord pe model, previziuni lunare și garduri de protecție bugetare — gata din start, fără să fie necesar un tablou de bord Datadog.

Tablou de bord costuri

Tendința cheltuielilor zilnice, defalcare pe model, top 10 cele mai costisitoare cereri. Vederea pe care CFO-ul chiar a cerut-o.

Previziune a cheltuielilor

Rata de consum din perioada recentă proiectată până la finalul lunii, ca să vedeți depășirile cu săptămâni înainte să ajungă pe card.

Alerte bugetare

Plafon lunar per cheie. Emailuri la 80% și 100%, cu cooldown, ca să nu fiți bombardat cu spam. Pauza automată opțională oprește complet buclele scăpate de sub control.

Webhook-uri semnate

Evenimente semnate HMAC pentru praguri de cheltuieli, cheie creată, cheie revocată, generare eșuată. Integrați-le cu PagerDuty, Slack sau propriul registru.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Fiabilitate

Se întâmplă întreruperi. Utilizatorii dvs. nu ar trebui să observe.

Failover multi-provider, rezervă regională și rutare bazată pe intenție transformă o dependență fragilă de un singur furnizor într-un strat redundant, cu autoremediere.

Failover multi-provider

Timeout-uri și politici de retry configurabile per cheie. La 5xx sau timeout, traficul este redirecționat transparent către următorul provider din lanț.

Exemplu de lanț de rezervă

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Cererea dvs. nu vede niciodată saltul eșuat. Bugetul de latență este aplicat end-to-end.

Rutare inteligentă

Spuneți-ne intenția — chat rapid, raționament profund, editare imagine, sumarizare pe termen lung — și alegem cel mai ieftin provider calificat. Blocați un model exact când aveți nevoie.

Rezervă regională

Dacă regiunea US-East a unui provider este degradată, încercăm US-West, apoi EU, înainte de a respinge cererea. Persistența pe regiune este configurabilă per cheie.

Guvernanță și securitate

Controale per cheie care trec de o analiză de securitate.

Chei scoped, limite de rată granulare, allowlist-uri IP, jurnal de audit imuabil și export CSV. Conceput pentru întrebările pe care le vor pune și CTO-ul, și auditorul.

Scopare cheie API

Allow/deny per cheie pentru modele, allowlist IP, plafoane zilnice și orare de cheltuieli. Rotați fără redeploy.

Limite de rată per cheie, per model

Limite RPM și TPM definite pentru cheie și model. O cheie de staging nu poate consuma accidental cota de producție.

Jurnal de audit imuabil

Fiecare cheie creată, schimbare de scope, mutare de buget sau revocare este înregistrată cu actor, IP și timestamp. Bazat implicit pe SOC2.

Jurnale căutabile + export CSV

Filtrați jurnalele de cereri după endpoint, model, status, latență, cheie. CSV cu un clic pentru finanțe, conformitate sau post-mortem.

Postură de conformitate

TLS 1.2+ end-to-end. Cheile sunt hashuite la stocare și nu sunt niciodată înregistrate în text clar.
Izolare per tenant pentru cheie + buget. Nicio scurgere de date între tenanturi.
Păstrare configurabilă a jurnalelor. Eliminați la cerere body-urile cererilor pentru workload-uri cu sensibilitate ridicată.
Rutare EU și US disponibilă la cerere pentru implementări sensibile la rezidența datelor.
Controale SOC2 în scop pentru 2026. Contactați-ne dacă aveți nevoie de o scrisoare actuală de la auditorul nostru.

Compatibilitate

Drop-in pentru SDK-ul OpenAI. Schimbați un singur base URL.

Hypereal vorbește OpenAI Chat Completions, Images, Responses și Anthropic Messages. Păstrați SDK-ul, prompturile, definițiile de tool, retry-urile — schimbați base URL-ul și cheia API, apoi livrați.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Endpointuri acceptate

POST /v1/chat/completions — compatibil OpenAI
POST /v1/messages — compatibil Anthropic
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — compatibil OpenAI
POST /v1/videos/generate — API video Hypereal
POST /v1/comfy/{slug} — workflow ComfyUI ca API
POST /v1/gpu/{slug} — passthrough GPU serverless

Compute

Dincolo de modele: compute ca API de primă clasă.

Fiecare echipă ajunge să aibă nevoie de mai mult decât chat completions — un graph ComfyUI personalizat, un fine-tune, o sarcină GPU unică. Hypereal le expune pe toate prin aceeași cheie, aceleași jurnale, aceleași bugete.

Passthrough GPU serverless

Folosți propriul handler RunPod și apelați-l ca POST /v1/gpu/{slug}. Noi gestionăm autentificarea, metering-ul, retry-urile și factura. Dvs. scrieți handlerul.

Workflow ComfyUI ca API

Încărcați orice JSON de workflow ComfyUI. Vă oferim un endpoint HTTP versionat, cu inputuri și outputuri tipizate, tarifat per rulare. Gata cu lipirea graph-urilor în Slack.

Bibliotecă ComfyUI

Un catalog în creștere de workflow-uri ComfyUI preconstruite — restaurare față, product shot, upscale cinematic — apelați-le ca pe orice alt model.

Repo de LoRA și asset-uri

Stocare privată, versionată pentru LoRA-uri, checkpoint-uri, embedding-uri și imagini de referință. Referiți-le prin handle din orice workflow sau generare.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Status și încredere

Numerele pe care le publicăm. Nu capturi de ecran într-un deck de vânzări.

Pagină de status live, latență transparentă și un istoric de incidente pe care îl puteți citi fără să ne întrebați mai întâi.

Pagină de status publică

Status live per endpoint și cronologia incidentelor.

Vezi pagina de status

Latență transparentă

p50 și p95 în rolling pentru fiecare endpoint gateway, pe regiuni.

Istoric uptime

Uptime pe ultimele 30/90 de zile, fără matematică de marketing. Cifra este cifra.

Nu mai rulați 8 tablou de borduri de furnizori.

O cheie API, o factură, un singur loc în care vedeți ce se întâmplă. Porniți în mai puțin de cinci minute.

Obțineți o cheie API Discutați cu vânzările Citiți documentația

Enterprise AI Gateway + Platformă de compute

O singură cheie. Fiecare model, fiecare GPU, fiecare workflow ComfyUI. Cu costul, auditul și fiabilitatea despre care CFO-ul și CTO-ul dvs. au întrebat deja.

Folosit în producție de echipe care livrează funcționalități de imagine, video, voce și chat către milioane de utilizatori finali.

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });