Enterprise AI Gateway + Compute Platform
Satu kunci. Setiap model, setiap GPU, setiap aliran kerja ComfyUI. Dengan kos, audit, dan kebolehpercayaan yang CFO dan CTO anda sudah tanyakan.
Digunakan dalam produksi oleh pasukan yang melancarkan ciri imej, video, suara, dan sembang kepada jutaan pengguna akhir.
Ketahui apa yang anda belanjakan sebelum invois tiba.
Setiap permintaan gateway dihargakan, dikaitkan, dan direkodkan secara masa nyata. Papan pemuka per-model, ramalan bulanan, dan pagar had bajet — sedia digunakan, tanpa perlu papan pemuka Datadog.
Papan Pemuka Kos
Trend perbelanjaan harian, pecahan per-model, 10 permintaan paling mahal. Paparan yang sebenarnya CFO anda minta.
Ramalan Perbelanjaan
Kadar pembakaran terkini diunjurkan hingga hujung bulan supaya anda boleh lihat lebihan belanja beberapa minggu sebelum ia dicaj ke kad anda.
Amaran Bajet
Had bulanan per-kunci. E-mel pada 80% dan 100% dengan cooldown supaya anda tidak dibanjiri spam. Auto-pause pilihan akan menghentikan gelung yang tidak terkawal.
Webhook Ditandatangani
Acara yang ditandatangani HMAC untuk ambang perbelanjaan, kunci dicipta, kunci dibatalkan, penjanaan gagal. Sambungkan ke PagerDuty, Slack, atau lejar anda sendiri.
Gangguan berlaku. Pengguna anda tidak sepatutnya perasan.
Failover berbilang pembekal, fallback serantau, dan penghalaan yang peka niat menukar kebergantungan satu pembekal yang rapuh kepada lapisan berlebihan dan boleh pulih sendiri.
Failover Berbilang Pembekal
Timeout dan dasar cubaan semula yang boleh dikonfigurasi per-kunci. Pada 5xx atau timeout, trafik akan dialihkan secara telus ke pembekal seterusnya dalam rantaian.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Penghalaan Pintar
Beritahu kami niat — sembang pantas, penaakulan mendalam, suntingan imej, ringkasan panjang — dan kami pilih pembekal yang layak dengan kos paling rendah. Pin model tepat apabila anda perlu.
Fallback Serantau
Jika wilayah US-East pembekal mengalami kemerosotan, kami cuba US-West, kemudian EU, sebelum permintaan gagal. Kekekalan wilayah boleh dikonfigurasi per-kunci.
Kawalan per-kunci yang lulus semakan keselamatan.
Kunci berlingkup, had kadar granular, allowlist IP, log audit tidak boleh diubah, dan eksport CSV. Direka untuk soalan yang akan ditanya oleh CTO dan juruaudit anda.
Skop Kunci API
Allow/deny per-kunci pada model, allowlist IP, had perbelanjaan harian dan sejam. Putar tanpa redeploy.
Had Kadar Per-Kunci, Per-Model
Had RPM dan TPM yang dihadkan kepada kunci dan model. Kunci staging tidak boleh secara tidak sengaja menghabiskan kuota prod.
Log Audit Tidak Boleh Diubah
Setiap kunci dicipta, skop diubah, bajet dipindahkan, atau pembatalan direkodkan dengan pelaku, IP, dan cap masa. SOC2-baseline secara lalai.
Log Boleh Dicari + Eksport CSV
Tapis log permintaan mengikut endpoint, model, status, latensi, kunci. CSV satu klik untuk kewangan, pematuhan, atau post-mortem.
Postur pematuhan
- TLS 1.2+ hujung ke hujung. Kunci di-hash semasa disimpan, tidak pernah dilog dalam plaintext.
- Pengasingan kunci + bajet per-tenant. Tiada kebocoran data merentas tenant.
- Pengekalan log boleh dikonfigurasi. Buang body permintaan atas permintaan untuk beban kerja sensitif tinggi.
- Penghalaan EU dan US tersedia atas permintaan untuk penempatan yang sensitif terhadap residensi.
- Kawalan SOC2 dalam skop untuk 2026. Hubungi kami jika anda perlukan surat terkini daripada juruaudit kami.
Gantian terus untuk OpenAI SDK. Tukar satu base URL.
Hypereal menyokong OpenAI Chat Completions, Images, Responses, dan Anthropic Messages. Kekalkan SDK, prompt, definisi alat, cubaan semula anda — tukar base URL dan kunci API, dan lancarkan.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Endpoint yang disokong
- POST /v1/chat/completions — serasi OpenAI
- POST /v1/messages — serasi Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — serasi OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — aliran kerja ComfyUI sebagai API
- POST /v1/gpu/{slug} — passthrough GPU tanpa server
Di luar model: compute sebagai API kelas pertama.
Setiap pasukan akhirnya memerlukan lebih daripada chat completions — graf ComfyUI tersuai, fine-tune, kerja GPU sekali sahaja. Hypereal mendedahkan semua itu di sebalik kunci yang sama, log yang sama, bajet yang sama.
Passthrough GPU Tanpa Server
Bawa pengendali RunPod anda sendiri dan panggilnya sebagai POST /v1/gpu/{slug}. Kami urus pengesahan, metering, cubaan semula, dan bil. Anda tulis pengendali.
Aliran Kerja ComfyUI sebagai API
Muat naik mana-mana JSON aliran kerja ComfyUI. Kami beri anda endpoint HTTP berversi dengan input dan output bertip, dicaj per run. Tiada lagi tampal graf dalam Slack.
Pustaka ComfyUI
Katalog aliran kerja ComfyUI pra-bina yang semakin berkembang — pemulihan wajah, shot produk, cinematic upscale — panggil seperti model lain.
Repositori LoRA & Aset
Penyimpanan peribadi dan berversi untuk LoRA, checkpoint, embedding, dan imej rujukan. Rujuk menggunakan handle daripada mana-mana aliran kerja atau penjanaan.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Nombor yang kami terbitkan. Bukan tangkapan skrin dalam deck jualan.
Halaman status masa nyata, latensi telus, dan sejarah insiden yang anda boleh baca tanpa perlu bertanya kepada kami dahulu.
Latensi telus
p50 dan p95 bergerak untuk setiap endpoint gateway, mengikut wilayah.
Sejarah uptime
Uptime 30/90 hari terkini, tanpa kiraan marketing. Nombor itu adalah nombor itu.
Hentikan penggunaan 8 papan pemuka vendor.
Satu kunci API, satu bil, satu tempat untuk melihat apa yang berlaku. Bermula dan berjalan dalam masa bawah lima minit.

