انٹرپرائز AI گیٹ وے + کمپیوٹ پلیٹ فارم
ایک کلید۔ ہر ماڈل، ہر GPU، ہر ComfyUI ورک فلو۔ اس لاگت، آڈٹ، اور قابل اعتماد کے ساتھ جس کے بارے میں آپ کے CFO اور CTO نے پہلے ہی پوچھا تھا۔
لاکھوں آخری صارفین کو تصویر، ویڈیو، آواز، اور چیٹ کی خصوصیات فراہم کرنے والی ٹیموں کے ذریعے پروڈکشن میں استعمال کیا جاتا ہے۔
انوائس آنے سے پہلے جان لیں کہ آپ کیا خرچ کرتے ہیں۔
ہر گیٹ وے درخواست کی قیمت، انتساب، اور حقیقی وقت میں لاگ ان کیا جاتا ہے۔ فی ماڈل ڈیش بورڈز، ماہانہ پیش گوئیاں، اور بجٹ گارڈریلز — بغیر کسی Datadog ڈیش بورڈ کی ضرورت کے۔
لاگت کا ڈیش بورڈ
روزانہ خرچ کا رجحان، فی ماڈل کی تفصیل، ٹاپ 10 سب سے مہنگی درخواستیں۔ وہ منظر جو آپ کے CFO نے اصل میں مانگا تھا۔
خرچ کی پیش گوئی
مہینے کے آخر تک متوقع برن ریٹ تاکہ آپ اپنی کارڈ پر آنے سے ہفتوں پہلے اووررنز دیکھ سکیں۔
بجٹ الرٹس
فی کلید ماہانہ حد۔ 80% اور 100% پر ای میلز ایک کول ڈاؤن کے ساتھ تاکہ آپ کو اسپام نہ کیا جائے۔ اختیاری آٹو-پاز بھاگتے ہوئے لوپس کو فوری طور پر ختم کر دیتا ہے۔
دستخط شدہ ویب ہکس
خرچ کی حدوں، کلید بنائی گئی، کلید منسوخ کی گئی، جنریشن ناکام ہونے کے لیے HMAC-دستخط شدہ ایونٹس۔ انہیں PagerDuty، Slack، یا اپنے لیجر میں شامل کریں۔
آؤٹیجز ہوتے ہیں۔ آپ کے صارفین کو محسوس نہیں ہونا چاہیے۔
ملٹی پرووائیڈر فیل اوور، علاقائی فال بیک، اور ارادے سے آگاہ روٹنگ ایک نازک سنگل وینڈر انحصار کو ایک فالتو، خود شفا بخش پرت میں بدل دیتی ہے۔
ملٹی پرووائیڈر فیل اوور
فی کلید قابل ترتیب ٹائم آؤٹ اور دوبارہ کوشش کی پالیسی۔ 5xx یا ٹائم آؤٹ پر، ٹریفک شفاف طریقے سے چین میں اگلے پرووائیڈر پر منتقل ہو جاتا ہے۔
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
سمارٹ روٹنگ
ہمیں ارادہ بتائیں — تیز چیٹ، گہری استدلال، تصویر میں ترمیم، طویل فارم کا خلاصہ — اور ہم سب سے سستا اہل پرووائیڈر منتخب کرتے ہیں۔ جب آپ کو ضرورت ہو تو ایک درست ماڈل کو پن کریں۔
علاقائی فال بیک
اگر کسی پرووائیڈر کا US-East علاقہ خراب ہو جاتا ہے، تو ہم US-West، پھر EU کی کوشش کرتے ہیں، اس سے پہلے کہ درخواست ناکام ہو جائے۔ علاقائی چپکنا فی کلید قابل ترتیب ہے۔
فی کلید کنٹرولز جو سیکیورٹی جائزہ کو مطمئن کرتے ہیں۔
اسکوپڈ کلیدیں، دانے دار ریٹ لمٹس، IP اجازت نامے، ناقابل تغیر آڈٹ لاگ، اور CSV ایکسپورٹ۔ ان سوالات کے لیے ڈیزائن کیا گیا ہے جو آپ کے CTO اور آپ کا آڈیٹر دونوں پوچھیں گے۔
API کلید کی اسکوپنگ
ماڈلز پر فی کلید اجازت/انکار، IP اجازت نامہ، روزانہ اور فی گھنٹہ خرچ کی حدیں۔ دوبارہ تعینات کیے بغیر گھمائیں۔
فی کلید، فی ماڈل ریٹ لمٹس
RPM اور TPM کی حدیں کلید اور ماڈل تک محدود ہیں۔ ایک اسٹیجنگ کلید غلطی سے پروڈ کے کوٹے کو ختم نہیں کر سکتی۔
ناقابل تغیر آڈٹ لاگ
ہر کلید بنائی گئی، دائرہ کار تبدیل کیا گیا، بجٹ منتقل کیا گیا، یا منسوخی کو اداکار، IP، اور ٹائم اسٹیمپ کے ساتھ ریکارڈ کیا جاتا ہے۔ SOC2-بیس لائن بطور ڈیفالٹ۔
تلاش کے قابل لاگز + CSV ایکسپورٹ
درخواست کے لاگز کو اینڈ پوائنٹ، ماڈل، حیثیت، لیٹینسی، کلید کے لحاظ سے فلٹر کریں۔ مالیات، تعمیل، یا پوسٹ مارٹم کے لیے ایک کلک CSV۔
تعمیل کی پوزیشن
- TLS 1.2+ اینڈ ٹو اینڈ۔ کلیدیں آرام پر ہیش کی گئیں، کبھی بھی سادہ متن میں لاگ نہیں کی گئیں۔
- فی کرایہ دار کلید + بجٹ کی تنہائی۔ کوئی کراس ٹیننٹ ڈیٹا لیکج نہیں۔
- قابل ترتیب لاگ برقرار رکھنا۔ اعلی حساسیت والے ورک لوڈز کے لیے مطالبہ پر درخواست کے باڈیز کو چھوڑ دیں۔
- رہائش کے حساس تعیناتیوں کے لیے درخواست پر EU اور US روٹنگ دستیاب ہے۔
- SOC2 کنٹرولز 2026 کے لیے دائرہ کار میں ہیں۔ اگر آپ کو ہمارے آڈیٹر سے موجودہ خط کی ضرورت ہو تو رابطہ کریں۔
OpenAI SDK کے لیے ڈراپ ان۔ ایک بیس URL تبدیل کریں۔
Hypereal OpenAI چیٹ کمپلیشنز، تصاویر، جوابات، اور Anthropic پیغامات بولتا ہے۔ اپنا SDK، اپنے پرامپٹس، اپنی ٹول کی تعریفیں، اپنی دوبارہ کوششیں رکھیں — بیس URL اور API کلید تبدیل کریں، بھیجیں۔
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});سپورٹ شدہ اینڈ پوائنٹس
- POST /v1/chat/completions — OpenAI-ہم آہنگ
- POST /v1/messages — Anthropic-ہم آہنگ
- POST /v1/responses — OpenAI جوابات API
- POST /v1/images/generations — OpenAI-ہم آہنگ
- POST /v1/videos/generate — Hypereal ویڈیو API
- POST /v1/comfy/{slug} — ComfyUI ورک فلو بطور API
- POST /v1/gpu/{slug} — سرور لیس GPU پاس تھرو
ماڈلز سے آگے: کمپیوٹ بطور فرسٹ کلاس API۔
ہر ٹیم کو بالآخر چیٹ کمپلیشنز سے زیادہ کی ضرورت ہوتی ہے — ایک کسٹم ComfyUI گراف، ایک فائن ٹیون، ایک ون آف GPU جاب۔ Hypereal انہیں اسی کلید، اسی لاگز، اسی بجٹ کے پیچھے ظاہر کرتا ہے۔
سرور لیس GPU پاس تھرو
اپنا RunPod ہینڈلر لائیں اور اسے POST /v1/gpu/{slug} کے طور پر کال کریں۔ ہم تصدیق، میٹرنگ، دوبارہ کوششیں، اور بل کو ہینڈل کرتے ہیں۔ آپ ہینڈلر لکھتے ہیں۔
ComfyUI ورک فلو بطور API
کوئی بھی ComfyUI ورک فلو JSON اپ لوڈ کریں۔ ہم آپ کو ٹائپ شدہ ان پٹس اور آؤٹ پٹس کے ساتھ ایک ورژن شدہ HTTP اینڈ پوائنٹ دیتے ہیں، جو فی رن بل کیا جاتا ہے۔ اب Slack میں گراف پیسٹ کرنے کی ضرورت نہیں۔
ComfyUI لائبریری
پہلے سے تیار کردہ ComfyUI ورک فلو کا ایک بڑھتا ہوا کیٹلاگ — چہرے کی بحالی، پروڈکٹ شاٹ، سینماٹک اپ اسکیل — انہیں کسی بھی دوسرے ماڈل کی طرح کال کریں۔
LoRA اور اثاثہ ریپو
LoRAs، چیک پوائنٹس، ایمبیڈنگز، اور حوالہ جاتی تصاویر کے لیے نجی، ورژن شدہ اسٹوریج۔ انہیں کسی بھی ورک فلو یا جنریشن سے ہینڈل کے ذریعے حوالہ دیں۔
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}وہ نمبر جو ہم شائع کرتے ہیں۔ سیلز ڈیک میں اسکرین شاٹس نہیں۔
لائیو اسٹیٹس پیج، شفاف لیٹینسی، اور ایک واقعہ کی تاریخ جسے آپ ہم سے پہلے پوچھے بغیر پڑھ سکتے ہیں۔
شفاف لیٹینسی
ہر گیٹ وے اینڈ پوائنٹ کے لیے رولنگ p50 اور p95، علاقے کے لحاظ سے۔
اپ ٹائم ہسٹری
ٹریلنگ 30/90 دن کا اپ ٹائم، کوئی مارکیٹنگ ریاضی نہیں۔ نمبر وہی ہے جو ہے۔
8 وینڈر ڈیش بورڈز چلانا بند کریں۔
ایک API کلید، ایک بل، اور سب کچھ دیکھنے کے لیے ایک ہی جگہ۔ پانچ منٹ سے بھی کم وقت میں تیار ہو جائیں۔

