Enterprise AI Gateway + Compute Platform
คีย์เดียว ทุกโมเดล ทุก GPU ทุกเวิร์กโฟลว์ ComfyUI พร้อมด้วยต้นทุน การตรวจสอบ และความน่าเชื่อถือที่ CFO และ CTO ของคุณต้องการ
ใช้งานจริงโดยทีมที่ส่งมอบฟีเจอร์รูปภาพ วิดีโอ เสียง และแชท ให้กับผู้ใช้ปลายทางหลายล้านคน
ทราบสิ่งที่คุณใช้จ่ายก่อนใบแจ้งหนี้จะมาถึง
คำขอเกตเวย์ทุกรายการจะถูกกำหนดราคา ระบุแหล่งที่มา และบันทึกแบบเรียลไทม์ แดชบอร์ดต่อโมเดล การคาดการณ์รายเดือน และการควบคุมงบประมาณ — พร้อมใช้งานทันที ไม่ต้องใช้แดชบอร์ด Datadog
แดชบอร์ดต้นทุน
แนวโน้มการใช้จ่ายรายวัน การแยกย่อยตามโมเดล คำขอ 10 อันดับแรกที่แพงที่สุด มุมมองที่ CFO ของคุณต้องการจริงๆ
การคาดการณ์การใช้จ่าย
อัตราการใช้จ่ายที่คาดการณ์ถึงสิ้นเดือน เพื่อให้คุณเห็นการใช้จ่ายเกินงบประมาณล่วงหน้าหลายสัปดาห์ก่อนที่จะถึงกำหนดชำระ
การแจ้งเตือนงบประมาณ
ขีดจำกัดรายเดือนต่อคีย์ อีเมลแจ้งเตือนที่ 80% และ 100% พร้อมช่วงเวลาพักเพื่อไม่ให้คุณถูกสแปม การหยุดชั่วคราวอัตโนมัติที่เป็นทางเลือกจะหยุดลูปที่ทำงานผิดปกติได้ทันที
Webhooks ที่ลงนามแล้ว
เหตุการณ์ที่ลงนามด้วย HMAC สำหรับเกณฑ์การใช้จ่าย, คีย์ที่สร้างขึ้น, คีย์ที่ถูกเพิกถอน, การสร้างล้มเหลว เชื่อมต่อเข้ากับ PagerDuty, Slack หรือบัญชีแยกประเภทของคุณเอง
เหตุขัดข้องเกิดขึ้นได้ แต่ผู้ใช้ของคุณไม่ควรสังเกตเห็น
การสลับไปใช้ผู้ให้บริการหลายราย, การสำรองข้อมูลตามภูมิภาค และการกำหนดเส้นทางที่รับรู้เจตนา จะเปลี่ยนการพึ่งพาผู้จำหน่ายรายเดียวที่เปราะบางให้กลายเป็นเลเยอร์ที่ซ้ำซ้อนและซ่อมแซมตัวเองได้
การสลับไปใช้ผู้ให้บริการหลายราย
สามารถกำหนดค่าการหมดเวลาต่อคีย์และนโยบายการลองใหม่ได้ เมื่อเกิดข้อผิดพลาด 5xx หรือหมดเวลา การรับส่งข้อมูลจะเปลี่ยนไปยังผู้ให้บริการรายถัดไปในห่วงโซ่อย่างโปร่งใส
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
การกำหนดเส้นทางอัจฉริยะ
บอกเราถึงเจตนาของคุณ — แชทเร็ว, การให้เหตุผลเชิงลึก, การแก้ไขภาพ, การสรุปเนื้อหายาว — แล้วเราจะเลือกผู้ให้บริการที่มีคุณสมบัติเหมาะสมและราคาถูกที่สุด คุณสามารถปักหมุดโมเดลที่แน่นอนได้เมื่อคุณต้องการ
การสำรองข้อมูลตามภูมิภาค
หากภูมิภาค US-East ของผู้ให้บริการมีประสิทธิภาพลดลง เราจะลอง US-West จากนั้น EU ก่อนที่จะยกเลิกคำขอ การยึดติดกับภูมิภาคสามารถกำหนดค่าได้ต่อคีย์
การควบคุมต่อคีย์ที่ผ่านการตรวจสอบความปลอดภัย
คีย์ที่จำกัดขอบเขต, ขีดจำกัดอัตราแบบละเอียด, รายการ IP ที่อนุญาต, บันทึกการตรวจสอบที่ไม่สามารถเปลี่ยนแปลงได้ และการส่งออก CSV ออกแบบมาสำหรับคำถามที่ CTO และผู้ตรวจสอบของคุณจะถาม
การกำหนดขอบเขตคีย์ API
อนุญาต/ปฏิเสธโมเดลต่อคีย์, รายการ IP ที่อนุญาต, ขีดจำกัดการใช้จ่ายรายวันและรายชั่วโมง หมุนเวียนได้โดยไม่ต้องปรับใช้ใหม่
ขีดจำกัดอัตราต่อคีย์ ต่อโมเดล
ขีดจำกัด RPM และ TPM ที่จำกัดขอบเขตตามคีย์และโมเดล คีย์สำหรับการจัดเตรียมไม่สามารถใช้โควตาของโปรดักชันโดยไม่ตั้งใจได้
บันทึกการตรวจสอบที่ไม่สามารถเปลี่ยนแปลงได้
ทุกคีย์ที่สร้างขึ้น, ขอบเขตที่เปลี่ยนแปลง, งบประมาณที่ย้าย หรือการเพิกถอนจะถูกบันทึกพร้อมกับผู้กระทำ, IP และการประทับเวลา เป็นไปตามมาตรฐาน SOC2 โดยค่าเริ่มต้น
บันทึกที่ค้นหาได้ + การส่งออก CSV
กรองบันทึกคำขอตามปลายทาง, โมเดล, สถานะ, ความหน่วง, คีย์ ส่งออก CSV ได้ในคลิกเดียวสำหรับฝ่ายการเงิน, การปฏิบัติตามข้อกำหนด หรือการวิเคราะห์หลังเกิดเหตุการณ์
สถานะการปฏิบัติตามข้อกำหนด
- TLS 1.2+ แบบ end-to-end คีย์จะถูกแฮชเมื่อไม่ได้ใช้งาน ไม่มีการบันทึกในรูปแบบข้อความธรรมดา
- การแยกคีย์ + งบประมาณต่อผู้เช่า ไม่มีการรั่วไหลของข้อมูลข้ามผู้เช่า
- การเก็บรักษาบันทึกที่กำหนดค่าได้ สามารถลบเนื้อหาคำขอได้ตามต้องการสำหรับปริมาณงานที่มีความละเอียดอ่อนสูง
- มีบริการกำหนดเส้นทางใน EU และ US ตามคำขอสำหรับการปรับใช้ที่คำนึงถึงถิ่นที่อยู่ของข้อมูล
- การควบคุม SOC2 อยู่ในขอบเขตสำหรับปี 2026 โปรดติดต่อเราหากคุณต้องการจดหมายปัจจุบันจากผู้ตรวจสอบของเรา
ใช้งานร่วมกับ OpenAI SDK ได้ทันที เพียงแค่เปลี่ยน Base URL
Hypereal รองรับ OpenAI Chat Completions, Images, Responses และ Anthropic Messages คุณสามารถใช้ SDK, prompts, การกำหนดเครื่องมือ, และการลองใหม่ (retries) ของคุณได้ เพียงแค่เปลี่ยน Base URL และคีย์ API ก็พร้อมใช้งาน
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});ปลายทางที่รองรับ
- POST /v1/chat/completions — เข้ากันได้กับ OpenAI
- POST /v1/messages — เข้ากันได้กับ Anthropic
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — เข้ากันได้กับ OpenAI
- POST /v1/videos/generate — Hypereal video API
- POST /v1/comfy/{slug} — เวิร์กโฟลว์ ComfyUI ในรูปแบบ API
- POST /v1/gpu/{slug} — การส่งผ่าน GPU แบบ Serverless
นอกเหนือจากโมเดล: การประมวลผลในฐานะ API ระดับเฟิร์สคลาส
ทุกทีมในที่สุดก็ต้องการมากกว่าแค่การสร้างแชท — กราฟ ComfyUI แบบกำหนดเอง, การปรับแต่ง (fine-tune), งาน GPU แบบครั้งเดียว Hypereal เปิดเผยสิ่งเหล่านี้ภายใต้คีย์เดียวกัน, บันทึกเดียวกัน, งบประมาณเดียวกัน
การส่งผ่าน GPU แบบ Serverless
นำ RunPod handler ของคุณมาเองและเรียกใช้เป็น POST /v1/gpu/{slug} เราจัดการการยืนยันตัวตน, การวัดปริมาณ, การลองใหม่, และการเรียกเก็บเงิน คุณมีหน้าที่เขียน handler
เวิร์กโฟลว์ ComfyUI ในรูปแบบ API
อัปโหลด JSON เวิร์กโฟลว์ ComfyUI ใดก็ได้ เราจะให้ปลายทาง HTTP ที่มีเวอร์ชันพร้อมอินพุตและเอาต์พุตแบบมีประเภท โดยคิดค่าบริการต่อการรัน ไม่ต้องคอยวางกราฟใน Slack อีกต่อไป
ไลบรารี ComfyUI
แค็ตตาล็อกเวิร์กโฟลว์ ComfyUI ที่สร้างไว้ล่วงหน้าซึ่งกำลังเติบโต — การกู้คืนใบหน้า, ภาพผลิตภัณฑ์, การเพิ่มคุณภาพแบบภาพยนตร์ — เรียกใช้ได้เหมือนโมเดลอื่นๆ
LoRA & ที่เก็บสินทรัพย์
พื้นที่เก็บข้อมูลส่วนตัวที่มีเวอร์ชันสำหรับ LoRA, checkpoints, embeddings และภาพอ้างอิง อ้างอิงสิ่งเหล่านี้ด้วย handle จากเวิร์กโฟลว์หรือการสร้างใดๆ
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}ตัวเลขที่เราเผยแพร่ ไม่ใช่ภาพหน้าจอในเอกสารการขาย
หน้าสถานะแบบเรียลไทม์, ความหน่วงที่โปร่งใส และประวัติเหตุการณ์ที่คุณสามารถอ่านได้โดยไม่ต้องสอบถามเราก่อน
ความหน่วงที่โปร่งใส
p50 และ p95 แบบเคลื่อนที่สำหรับทุกปลายทางของเกตเวย์ แยกตามภูมิภาค
ประวัติการทำงาน
การทำงานย้อนหลัง 30/90 วัน ไม่มีกลยุทธ์ทางการตลาด ตัวเลขคือตัวเลข
หยุดใช้งานแดชบอร์ดของผู้จำหน่าย 8 ราย
คีย์ API เดียว, ใบแจ้งหนี้เดียว, ที่เดียวเพื่อดูว่าเกิดอะไรขึ้น เริ่มต้นใช้งานได้ภายในเวลาไม่ถึงห้านาที

