এন্টারপ্রাইজ AI গেটওয়ে + কম্পিউট প্ল্যাটফর্ম
একটি কী। প্রতিটি মডেল, প্রতিটি GPU, প্রতিটি ComfyUI ওয়ার্কফ্লো। আপনার CFO এবং CTO ইতিমধ্যেই যে খরচ, নিরীক্ষা এবং নির্ভরযোগ্যতা সম্পর্কে জিজ্ঞাসা করেছেন তা সহ।
লক্ষ লক্ষ শেষ ব্যবহারকারীদের কাছে ছবি, ভিডিও, ভয়েস এবং চ্যাট ফিচার সরবরাহকারী দলগুলি দ্বারা প্রোডাকশনে ব্যবহৃত হচ্ছে।
ইনভয়েস আসার আগেই আপনি কী খরচ করেন তা জানুন।
প্রতিটি গেটওয়ে রিকোয়েস্ট রিয়েল টাইমে মূল্য নির্ধারণ করা হয়, অ্যাট্রিবিউট করা হয় এবং লগ করা হয়। প্রতি-মডেল ড্যাশবোর্ড, মাসিক পূর্বাভাস এবং বাজেট গার্ডরেল — বক্সের বাইরে, কোনো Datadog ড্যাশবোর্ড প্রয়োজন নেই।
খরচ ড্যাশবোর্ড
দৈনিক ব্যয়ের প্রবণতা, প্রতি-মডেল বিভাজন, শীর্ষ-১০টি সবচেয়ে ব্যয়বহুল রিকোয়েস্ট। আপনার CFO আসলে যে ভিউ চেয়েছিলেন।
ব্যয় পূর্বাভাস
মাস-শেষ পর্যন্ত ট্রেইলিং বার্ন রেট প্রজেক্ট করা হয়েছে যাতে আপনার কার্ডে আঘাত হানার কয়েক সপ্তাহ আগে আপনি ওভাররান দেখতে পারেন।
বাজেট সতর্কতা
প্রতি-কী মাসিক ক্যাপ। ৮০% এবং ১০০% এ ইমেল সহ একটি কুলডাউন যাতে আপনি স্প্যাম না হন। ঐচ্ছিক অটো-পজ রানওয়ে লুপগুলিকে মেরে ফেলে।
স্বাক্ষরিত ওয়েবহুক
ব্যয় থ্রেশহোল্ড, কী তৈরি, কী বাতিল, জেনারেশন ব্যর্থতার জন্য HMAC-স্বাক্ষরিত ইভেন্ট। সেগুলিকে PagerDuty, Slack, বা আপনার নিজস্ব লেজারে ওয়্যার করুন।
আউটেজ ঘটে। আপনার ব্যবহারকারীদের তা লক্ষ্য করা উচিত নয়।
মাল্টি-প্রোভাইডার ফেইলওভার, আঞ্চলিক ফলব্যাক এবং ইন্টেন্ট-সচেতন রাউটিং একটি ভঙ্গুর একক-বিক্রেতা নির্ভরতাকে একটি রিডানড্যান্ট, স্ব-নিরাময়কারী স্তরে পরিণত করে।
মাল্টি-প্রোভাইডার ফেইলওভার
কনফিগারযোগ্য প্রতি-কী টাইমআউট এবং রিট্রাই নীতি। 5xx বা টাইমআউটে, ট্র্যাফিক চেইনের পরবর্তী প্রোভাইডারে স্বচ্ছভাবে রোল করে।
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
স্মার্ট রাউটিং
আমাদেরকে আপনার উদ্দেশ্য বলুন — দ্রুত চ্যাট, গভীর যুক্তি, ছবি এডিট, দীর্ঘ-ফর্মের সারসংক্ষেপ — এবং আমরা সবচেয়ে সস্তা যোগ্য প্রদানকারীকে বেছে নেব। প্রয়োজনে একটি নির্দিষ্ট মডেল পিন করুন।
আঞ্চলিক ফলব্যাক
যদি কোনো প্রদানকারীর US-East অঞ্চল ক্ষতিগ্রস্ত হয়, আমরা রিকোয়েস্ট ব্যর্থ হওয়ার আগে US-West, তারপর EU চেষ্টা করি। প্রতিটি কী-এর জন্য অঞ্চল-সংযুক্তি কনফিগার করা যায়।
প্রতি-কী নিয়ন্ত্রণ যা একটি নিরাপত্তা পর্যালোচনাকে সন্তুষ্ট করে।
স্কোপড কী, গ্রানুলার রেট লিমিট, আইপি অ্যালাওলিস্ট, অপরিবর্তনীয় অডিট লগ এবং CSV এক্সপোর্ট। আপনার CTO এবং আপনার অডিটর উভয়ই যে প্রশ্নগুলি জিজ্ঞাসা করবেন তার জন্য ডিজাইন করা হয়েছে।
API কী স্কোপিং
মডেল, আইপি অ্যালাওলিস্ট, দৈনিক এবং প্রতি ঘণ্টার ব্যয় ক্যাপের উপর প্রতি-কী অনুমতি/অস্বীকার। পুনরায় স্থাপন না করেই ঘোরান।
প্রতি-কী, প্রতি-মডেল রেট লিমিট
RPM এবং TPM লিমিট কী এবং মডেলের জন্য স্কোপ করা হয়েছে। একটি স্টেজিং কী ভুলবশত প্রোডাকশনের কোটা শেষ করতে পারবে না।
অপরিবর্তনীয় অডিট লগ
তৈরি করা প্রতিটি কী, স্কোপ পরিবর্তন, বাজেট সরানো, বা বাতিলকরণ অভিনেতা, আইপি এবং টাইমস্ট্যাম্প সহ রেকর্ড করা হয়। ডিফল্টরূপে SOC2-বেসলাইন।
অনুসন্ধানযোগ্য লগ + CSV এক্সপোর্ট
এন্ডপয়েন্ট, মডেল, স্ট্যাটাস, লেটেন্সি, কী দ্বারা রিকোয়েস্ট লগ ফিল্টার করুন। অর্থ, সম্মতি, বা পোস্ট-মর্টেমের জন্য এক-ক্লিকে CSV।
কমপ্লায়েন্স পোজিশন
- TLS 1.2+ এন্ড-টু-এন্ড। কীগুলি রেস্টে হ্যাশ করা হয়, কখনও প্লেইনটেক্সটে লগ করা হয় না।
- প্রতি-টেন্যান্ট কী + বাজেট আইসোলেশন। কোনো ক্রস-টেন্যান্ট ডেটা লিক নেই।
- কনফিগারযোগ্য লগ রিটেনশন। উচ্চ-সংবেদনশীলতার ওয়ার্কলোডের জন্য চাহিদা অনুযায়ী রিকোয়েস্ট বডি ড্রপ করুন।
- রেসিডেন্সি-সংবেদনশীল স্থাপনার জন্য অনুরোধের ভিত্তিতে EU এবং US রাউটিং উপলব্ধ।
- SOC2 নিয়ন্ত্রণ 2026 সালের জন্য স্কোপে রয়েছে। আমাদের অডিটরের কাছ থেকে একটি বর্তমান চিঠির প্রয়োজন হলে যোগাযোগ করুন।
OpenAI SDK-এর জন্য ড্রপ-ইন। একটি বেস URL অদলবদল করুন।
Hypereal OpenAI চ্যাট কমপ্লিশন, ছবি, রেসপন্স এবং Anthropic মেসেজ সমর্থন করে। আপনার SDK, আপনার প্রম্পট, আপনার টুল ডেফিনিশন, আপনার রিট্রাইগুলি রাখুন — বেস URL এবং API কী পরিবর্তন করুন, প্রকাশ করুন।
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});সমর্থিত এন্ডপয়েন্ট
- POST /v1/chat/completions — OpenAI-সামঞ্জস্যপূর্ণ
- POST /v1/messages — Anthropic-সামঞ্জস্যপূর্ণ
- POST /v1/responses — OpenAI রেসপন্স API
- POST /v1/images/generations — OpenAI-সামঞ্জস্যপূর্ণ
- POST /v1/videos/generate — Hypereal ভিডিও API
- POST /v1/comfy/{slug} — ComfyUI ওয়ার্কফ্লো API হিসাবে
- POST /v1/gpu/{slug} — সার্ভারলেস GPU পাসথ্রু
মডেলের বাইরে: একটি ফার্স্ট-ক্লাস API হিসাবে কম্পিউট।
প্রতিটি দলের শেষ পর্যন্ত চ্যাট কমপ্লিশনের চেয়ে বেশি কিছু প্রয়োজন হয় — একটি কাস্টম ComfyUI গ্রাফ, একটি ফাইন-টিউন, একটি ওয়ান-অফ GPU কাজ। Hypereal সেগুলিকে একই কী, একই লগ, একই বাজেটের পিছনে প্রকাশ করে।
সার্ভারলেস GPU পাসথ্রু
আপনার নিজস্ব RunPod হ্যান্ডলার আনুন এবং এটিকে POST /v1/gpu/{slug} হিসাবে কল করুন। আমরা প্রমাণীকরণ, মিটারিং, রিট্রাই এবং বিল পরিচালনা করি। আপনি হ্যান্ডলার লিখুন।
ComfyUI ওয়ার্কফ্লো API হিসাবে
যেকোনো ComfyUI ওয়ার্কফ্লো JSON আপলোড করুন। আমরা আপনাকে টাইপ করা ইনপুট এবং আউটপুট সহ একটি সংস্করণযুক্ত HTTP এন্ডপয়েন্ট দিই, যা প্রতি রান বিল করা হয়। স্ল্যাকে আর গ্রাফ পেস্ট করার দরকার নেই।
ComfyUI লাইব্রেরি
প্রি-বিল্ট ComfyUI ওয়ার্কফ্লোগুলির একটি ক্রমবর্ধমান ক্যাটালগ — ফেস রিস্টোর, প্রোডাক্ট শট, সিনেম্যাটিক আপস্কেল — সেগুলিকে অন্য যেকোনো মডেলের মতো কল করুন।
LoRA এবং অ্যাসেট রেপো
LoRA, চেকপয়েন্ট, এম্বেডিং এবং রেফারেন্স ছবির জন্য ব্যক্তিগত, সংস্করণযুক্ত স্টোরেজ। যেকোনো ওয়ার্কফ্লো বা জেনারেশন থেকে হ্যান্ডেল দ্বারা সেগুলিকে রেফারেন্স করুন।
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}আমরা যে সংখ্যাগুলি প্রকাশ করি। বিক্রয় ডেক-এর স্ক্রিনশট নয়।
লাইভ স্ট্যাটাস পেজ, স্বচ্ছ লেটেন্সি এবং একটি ঘটনা ইতিহাস যা আপনি আমাদের জিজ্ঞাসা না করেই পড়তে পারেন।
স্বচ্ছ লেটেন্সি
প্রতিটি গেটওয়ে এন্ডপয়েন্টের জন্য রোলিং p50 এবং p95, অঞ্চল অনুসারে।
আপটাইম ইতিহাস
ট্রেইলিং 30/90-দিনের আপটাইম, কোনো মার্কেটিং গণিত নয়। সংখ্যাটিই সংখ্যা।
8টি ভেন্ডর ড্যাশবোর্ড চালানো বন্ধ করুন।
একটি API কী, একটি বিল, কী ঘটছে তা দেখার জন্য একটি জায়গা। পাঁচ মিনিটেরও কম সময়ে কাজ শুরু করুন।

