Gateway AI Perusahaan + Platform Komputasi
Satu kunci. Setiap model, setiap GPU, setiap alur kerja ComfyUI. Dengan biaya, audit, dan keandalan yang sudah ditanyakan oleh CFO dan CTO Anda.
Digunakan dalam produksi oleh tim yang mengirimkan fitur gambar, video, suara, dan obrolan kepada jutaan pengguna akhir.
Ketahui pengeluaran Anda sebelum tagihan tiba.
Setiap permintaan gateway diberi harga, diatribusikan, dan dicatat secara real time. Dasbor per model, perkiraan bulanan, dan batasan anggaran — siap pakai, tidak memerlukan dasbor Datadog.
Dasbor Biaya
Tren pengeluaran harian, rincian per model, 10 permintaan termahal. Tampilan yang sebenarnya diminta oleh CFO Anda.
Perkiraan Pengeluaran
Tingkat pembakaran yang tertinggal diproyeksikan hingga akhir bulan sehingga Anda dapat melihat kelebihan pengeluaran berminggu-minggu sebelum membebani kartu Anda.
Peringatan Anggaran
Batas bulanan per kunci. Email pada 80% dan 100% dengan waktu tunggu agar Anda tidak menerima spam. Jeda otomatis opsional menghentikan loop yang tidak terkendali.
Webhook Bertanda Tangan
Peristiwa bertanda tangan HMAC untuk ambang batas pengeluaran, kunci dibuat, kunci dicabut, pembuatan gagal. Hubungkan ke PagerDuty, Slack, atau buku besar Anda sendiri.
Pemadaman terjadi. Pengguna Anda seharusnya tidak menyadarinya.
Failover multi-penyedia, fallback regional, dan perutean yang sadar niat mengubah ketergantungan vendor tunggal yang rapuh menjadi lapisan yang redundan dan menyembuhkan diri sendiri.
Failover Multi-Penyedia
Batas waktu per kunci yang dapat dikonfigurasi dan kebijakan coba lagi. Pada 5xx atau batas waktu, lalu lintas secara transparan beralih ke penyedia berikutnya dalam rantai.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Smart Routing
Beri tahu kami maksudnya — obrolan cepat, penalaran mendalam, pengeditan gambar, ringkasan bentuk panjang — dan kami akan memilih penyedia yang paling murah dan berkualitas. Sematkan model yang tepat saat Anda membutuhkannya.
Fallback Regional
Jika wilayah US-East penyedia mengalami penurunan kualitas, kami akan mencoba US-West, lalu EU, sebelum membatalkan permintaan. Region-stickiness dapat dikonfigurasi per kunci.
Kontrol per-kunci yang memenuhi tinjauan keamanan.
Kunci dengan cakupan, batas laju granular, daftar izin IP, log audit yang tidak dapat diubah, dan ekspor CSV. Dirancang untuk pertanyaan yang akan diajukan oleh CTO dan auditor Anda.
Cakupan Kunci API
Izinkan/tolak per-kunci pada model, daftar izin IP, batas pengeluaran harian dan per jam. Rotasi tanpa penyebaran ulang.
Batas Laju Per-Kunci, Per-Model
Batas RPM dan TPM dicakupkan ke kunci dan model. Kunci staging tidak dapat secara tidak sengaja menguras kuota produksi.
Log Audit yang Tidak Dapat Diubah
Setiap kunci yang dibuat, cakupan yang diubah, anggaran yang dipindahkan, atau pencabutan dicatat dengan aktor, IP, dan stempel waktu. SOC2-baseline secara default.
Log yang Dapat Dicari + Ekspor CSV
Saring log permintaan berdasarkan endpoint, model, status, latensi, kunci. CSV sekali klik untuk keuangan, kepatuhan, atau post-mortem.
Postur kepatuhan
- TLS 1.2+ end-to-end. Kunci di-hash saat tidak digunakan, tidak pernah dicatat dalam bentuk teks biasa.
- Isolasi kunci + anggaran per-penyewa. Tidak ada kebocoran data antar-penyewa.
- Retensi log yang dapat dikonfigurasi. Hapus badan permintaan sesuai permintaan untuk beban kerja dengan sensitivitas tinggi.
- Perutean EU dan AS tersedia berdasarkan permintaan untuk deployment yang sensitif terhadap residensi data.
- Kontrol SOC2 dalam cakupan untuk tahun 2026. Hubungi kami jika Anda memerlukan surat terkini dari auditor kami.
Drop-in untuk OpenAI SDK. Tukar satu URL dasar.
Hypereal berbicara OpenAI Chat Completions, Images, Responses, dan Anthropic Messages. Pertahankan SDK Anda, prompt Anda, definisi alat Anda, percobaan ulang Anda — ubah URL dasar dan kunci API, lalu kirim.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Endpoint yang didukung
- POST /v1/chat/completions — Kompatibel dengan OpenAI
- POST /v1/messages — Kompatibel dengan Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — Kompatibel dengan OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — Alur kerja ComfyUI sebagai API
- POST /v1/gpu/{slug} — Passthrough GPU tanpa server
Lebih dari model: komputasi sebagai API kelas satu.
Setiap tim pada akhirnya membutuhkan lebih dari penyelesaian obrolan — grafik ComfyUI kustom, fine-tune, pekerjaan GPU satu kali. Hypereal mengeksposnya di balik kunci yang sama, log yang sama, anggaran yang sama.
Passthrough GPU Tanpa Server
Bawa handler RunPod Anda sendiri dan panggil sebagai POST /v1/gpu/{slug}. Kami menangani otentikasi, pengukuran, percobaan ulang, dan tagihan. Anda menulis handler.
Alur Kerja ComfyUI sebagai API
Unggah JSON alur kerja ComfyUI apa pun. Kami memberi Anda endpoint HTTP versi dengan input dan output bertipe, ditagih per eksekusi. Tidak perlu lagi menempel grafik di Slack.
Pustaka ComfyUI
Katalog alur kerja ComfyUI yang terus berkembang — pemulihan wajah, foto produk, peningkatan sinematik — panggil mereka seperti model lainnya.
Repo LoRA & Aset
Penyimpanan pribadi dan versi untuk LoRA, checkpoint, embedding, dan gambar referensi. Referensikan mereka berdasarkan handle dari alur kerja atau pembuatan apa pun.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Angka yang kami publikasikan. Bukan tangkapan layar di dek penjualan.
Halaman status langsung, latensi transparan, dan riwayat insiden yang dapat Anda baca tanpa bertanya kepada kami terlebih dahulu.
Latensi transparan
p50 dan p95 bergulir untuk setiap endpoint gateway, berdasarkan wilayah.
Riwayat uptime
Uptime 30/90 hari terakhir, tanpa perhitungan pemasaran. Angka adalah angka.
Berhenti menjalankan 8 dasbor vendor.
Satu kunci API, satu tagihan, satu tempat untuk melihat apa yang terjadi. Mulai dan jalankan dalam waktu kurang dari lima menit.

