Ang Hypereal Platform

Enterprise AI Gateway + Compute Platform

Isang key. Bawat model, bawat GPU, bawat ComfyUI workflow. Kasama ang cost, audit, at reliability na tinanong na ng iyong CFO at CTO.

Kumuha ng API key Makipag-usap sa sales

Ginagamit sa production ng mga team na naglalabas ng image, video, voice, at chat features para sa milyon-milyong end user.

Cost at Spend

Alamin kung magkano ang ginagastos mo bago pa dumating ang invoice.

Bawat gateway request ay pinapresyo, ina-attribute, at nire-record nang real time. May mga dashboard per model, monthly forecast, at budget guardrail — built in, hindi mo na kailangan ng Datadog dashboard.

Cost Dashboard

Araw-araw na trend ng spend, breakdown per model, top-10 na pinakamahal na request. Ang view na talagang hiniling ng iyong CFO.

Spend Forecast

Ang trailing burn rate ay ine-project hanggang katapusan ng buwan para makita mo ang overspend ilang linggo bago pa ito umabot sa card mo.

Budget Alerts

Monthly cap bawat key. Mga email sa 80% at 100% na may cooldown para hindi ka ma-spam. Ang optional auto-pause ay agad na pumipigil sa runaway loops.

Signed Webhooks

Mga event na HMAC-signed para sa spend thresholds, key created, key revoked, generation failed. Ikonekta ito sa PagerDuty, Slack, o sarili mong ledger.

this month

apr 1 — apr 30

spend

$1,847.22

forecast

$2,640

requests

184,302

avg cost / call

$0.0100

gpt-4.1-mini

$702.94

seedance-1.5

$443.33

nano-banana

$313.93

flux-2-pro

$203.19

claude-haiku

$110.83

others

$73.00

Reliability

Nangyayari ang outages. Hindi dapat mapansin ito ng mga user mo.

Ang multi-provider failover, regional fallback, at intent-aware routing ay ginagawang redundant at self-healing layer ang marupok na single-vendor dependency.

Multi-Provider Failover

Nako-configure ang timeout at retry policy per key. Kapag may 5xx o timeout, awtomatikong ililipat ang traffic sa susunod na provider sa chain.

Halimbawang fallback chain

POST /v1/chat/completions
  ├── primary    → openai/gpt-4.1-mini      [503 in 8s] ✗
  ├── fallback 1 → google/gemini-2.5-flash  [200 in 612ms] ✓
  └── fallback 2 → anthropic/claude-haiku   (skipped)

served 200 OK · upstream: gemini · total 624ms

Hindi kailanman nakikita ng iyong request ang failed hop. Pinapairal ang latency budget mula dulo hanggang dulo.

Smart Routing

Sabihin sa amin ang intent — mabilis na chat, masusing reasoning, pag-edit ng larawan, mahabang summarization — at pipiliin namin ang pinakamurang kwalipikadong provider. I-pin ang eksaktong model kapag kailangan mo.

Regional Fallback

Kung degraded ang US-East region ng isang provider, susubukan muna namin ang US-West, saka EU, bago i-fail ang request. Nako-configure per key ang region-stickiness.

Governance & Security

Per-key na controls na pumapasa sa security review.

Scoped keys, granular rate limits, IP allowlists, immutable audit log, at CSV export. Dinisenyo para sa mga tanong na parehong itatanong ng CTO mo at ng auditor mo.

API Key Scoping

Per-key allow/deny sa mga model, IP allowlist, daily at hourly spend caps. Mag-rotate nang hindi nagde-deploy muli.

Per-Key, Per-Model Rate Limits

RPM at TPM limits na naka-scope sa key at sa model. Hindi aksidenteng mauubos ng staging key ang quota ng prod.

Immutable Audit Log

Bawat key na ginawa, scope na binago, budget na inilipat, o revocation ay nire-record kasama ang actor, IP, at timestamp. SOC2-baseline bilang default.

Searchable Logs + CSV Export

I-filter ang request logs ayon sa endpoint, model, status, latency, key. One-click CSV para sa finance, compliance, o post-mortem.

Compliance posture

TLS 1.2+ end-to-end. Ang mga key ay naka-hash at rest, at hindi kailanman nilo-log sa plaintext.
Per-tenant key + budget isolation. Walang cross-tenant data leakage.
Nako-configure na log retention. I-drop ang request bodies on demand para sa high-sensitivity workloads.
Available ang EU at US routing kapag hiniling para sa mga deployment na sensitibo sa residency.
Kasama sa scope ang SOC2 controls para sa 2026. Makipag-ugnayan kung kailangan mo ng current letter mula sa aming auditor.

Compatibility

Drop-in para sa OpenAI SDK. Palitan lang ang isang base URL.

Nagsasalita ang Hypereal ng OpenAI Chat Completions, Images, Responses, at Anthropic Messages. Panatilihin ang SDK mo, ang prompts mo, ang tool definitions mo, ang retries mo — palitan ang base URL at ang API key, ship.

curl

curl https://api.hypereal.cloud/v1/chat/completions \
  -H "Authorization: Bearer $HYPEREAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [{ "role": "user", "content": "hi" }]
  }'

Node SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.HYPEREAL_API_KEY,
  baseURL: "https://api.hypereal.cloud/v1",
});

const res = await client.chat.completions.create({
  model: "gpt-4.1-mini",
  messages: [{ role: "user", content: "hi" }],
});

Supported endpoints

POST /v1/chat/completions — OpenAI-compatible
POST /v1/messages — Anthropic-compatible
POST /v1/responses — OpenAI Responses API
POST /v1/images/generations — OpenAI-compatible
POST /v1/videos/generate — Hypereal video API
POST /v1/comfy/{slug} — ComfyUI workflow as API
POST /v1/gpu/{slug} — Serverless GPU passthrough

Compute

Higit pa sa mga model: compute bilang first-class API.

Sa kalaunan, bawat team ay mangangailangan ng higit pa sa chat completions — isang custom na ComfyUI graph, isang fine-tune, isang one-off na GPU job. Inilalantad ng Hypereal ang mga iyon sa likod ng iisang key, iisang logs, iisang budgets.

Serverless GPU Passthrough

Dalhin ang sarili mong RunPod handler at tawagin ito bilang POST /v1/gpu/{slug}. Kami ang bahala sa auth, metering, retries, at bill. Ikaw ang magsusulat ng handler.

ComfyUI Workflow as API

Mag-upload ng kahit anong ComfyUI workflow JSON. Bibigyan ka namin ng versioned HTTP endpoint na may typed inputs at outputs, sinisingil per run. Wala nang pag-paste ng graphs sa Slack.

ComfyUI Library

Isang lumalaking catalog ng pre-built na ComfyUI workflows — face restore, product shot, cinematic upscale — tawagin sila tulad ng anumang ibang model.

LoRA & Asset Repo

Private, versioned storage para sa mga LoRA, checkpoints, embeddings, at reference images. I-reference sila gamit ang handle mula sa kahit anong workflow o generation.

POST /v1/comfy/cinematic-upscale
{
  "inputs": { "image_url": "https://...", "strength": 0.8 },
  "version": "v3"
}

POST /v1/gpu/my-handler
{
  "input": { "prompt": "a cat", "steps": 28 }
}

Status & Trust

Mga numerong inilalathala namin. Hindi screenshots sa sales deck.

Live status page, transparent latency, at incident history na mababasa mo nang hindi muna nagtatanong sa amin.

Public status page

Live na per-endpoint status at incident timeline.

Tingnan ang status page

Transparent latency

Rolling p50 at p95 para sa bawat gateway endpoint, ayon sa region.

Uptime history

Trailing 30/90-day uptime, walang marketing math. Ang numero ay ang numero.

Itigil ang pagpapatakbo ng 8 vendor dashboards.

Isang API key, isang bill, isang lugar para makita kung ano ang nangyayari. Makapagsimula sa loob ng wala pang limang minuto.

Kumuha ng API key Makipag-usap sa sales Basahin ang docs

POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms

curl https://api.hypereal.cloud/v1/chat/completions \ -H "Authorization: Bearer $HYPEREAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4.1-mini", "messages": [{ "role": "user", "content": "hi" }] }'

import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.HYPEREAL_API_KEY, baseURL: "https://api.hypereal.cloud/v1", }); const res = await client.chat.completions.create({ model: "gpt-4.1-mini", messages: [{ role: "user", content: "hi" }], });