एंटरप्राइज-ग्रेड कोडिंग और LLM API
कोडिंग एजेंट, IDE इंटीग्रेशन, आंतरिक टूल और प्रोडक्शन LLM वर्कलोड के लिए एक Hypereal API key का उपयोग करें। Enterprise API OpenAI-compatible और Anthropic-native है, और उन टीमों के लिए एक क्यूरेटेड मॉडल सेट एक्सपोज़ करता है जिन्हें पूर्वानुमानित मॉडल IDs, इमेज जनरेशन, बिलिंग और उपयोग लॉग चाहिए।
-max में समाप्त होने वाले CLI-only Claude मॉडल IDs (जैसे claude-opus-4-7-max) केवल Anthropic-native एंडपॉइंट के विरुद्ध Claude Code CLI के माध्यम से समर्थित हैं। किसी अन्य क्लाइंट या थर्ड-पार्टी रैपर के साथ इन मॉडलों का उपयोग सख्त रूप से प्रतिबंधित है और इसके परिणामस्वरूप रिक्वेस्ट ब्लॉक हो जाएगी और बिना रिफंड के API key सस्पेंड कर दी जाएगी। इसमें Hermes, OpenClaw और इसी तरह के प्रॉक्सी, रिप्ले या अकाउंट-पूलिंग टूल शामिल हैं, लेकिन इन्हीं तक सीमित नहीं। स्टैंडर्ड (non--max) मॉडल अप्रभावित हैं और सभी क्लाइंट के लिए उपलब्ध रहते हैं।
Claude Code, कोडिंग एजेंट, रिव्यू बॉट, IDE टूल और आंतरिक ऑटोमेशन के साथ इसका उपयोग करें जो पहले से ही OpenAI या Anthropic APIs बोलते हैं।
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen और Kimi स्थिर Hypereal मॉडल IDs के पीछे एक्सपोज़ किए गए हैं।
मल्टीमोडल रिस्पॉन्स फील्ड और अकाउंट-लेवल उपयोग नियंत्रणों के साथ उसी मैनेज्ड चैट कम्पलीशन एंडपॉइंट के ज़रिए इमेज जनरेट करें।
Hypereal API keys एक अकाउंट-लेवल कंट्रोल प्लेन में खर्च सीमाएं, मॉडल स्कोपिंग, उपयोग लॉग और credit बिलिंग एक साथ रखती हैं।
सफल Enterprise API रिक्वेस्ट में लेटेंसी इंश्योरेंस मेटाडेटा और असामान्य रूप से लंबे समय तक चलने पर स्वचालित credit मुआवज़ा शामिल है।
चैट कम्पलीशन कॉल करें
क्यूरेटेड Enterprise मॉडल कैटलॉग और स्थिर Hypereal मॉडल IDs के लिए मैनेज्ड बेस पाथ का उपयोग करें।
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);चैट कम्पलीशन के ज़रिए इमेज जनरेट करें
मल्टीमोडल चैट कम्पलीशन के साथ Nano Banana 2 का उपयोग करें, या GPT Image 2 के लिए OpenAI-compatible इमेज जनरेशन एंडपॉइंट कॉल करें। मॉडल IDs nano-banana-2 और gpt-image-2 का उपयोग करें। मल्टीमोडल चैट इमेज फील्ड base64 data URL रिटर्न करती हैं, जबकि इमेज जनरेशन OpenAI इमेज रिस्पॉन्स शेप रिटर्न करती है।
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Anthropic-native एंडपॉइंट का उपयोग करें
Claude Code और Anthropic SDK क्लाइंट को Hypereal API रूट पर पॉइंट करना चाहिए क्योंकि वे नेटिव मैसेज पाथ खुद जोड़ते हैं। Raw HTTP क्लाइंट मैनेज्ड मैसेज पाथ को सीधे कॉल कर सकते हैं। टूल यूज़, थिंकिंग ब्लॉक, स्ट्रीमिंग और प्रॉम्प्ट कैश फील्ड सुरक्षित रखे जाते हैं।
CLI-only Claude मॉडल IDs (-max सफिक्स) केवल Claude Code CLI से ही उपयोग किए जाने चाहिए। Hermes या OpenClaw जैसे थर्ड-पार्टी रैपर इस टियर पर अनुमत नहीं हैं।
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'समर्थित Enterprise मॉडल
कीमतें प्रति दस लाख टोकन दिखाई जाती हैं और Hypereal Credits के ज़रिए बिल की जाती हैं।
| मॉडल ID | नाम | कॉन्टेक्स्ट | इनपुट | Cache read | Cache write | आउटपुट |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-6-max | Claude Opus 4.6 (1M) | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-5-max | Claude Opus 4.5 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-sonnet-4-5-max | Claude Sonnet 4.5 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-4-5-max | Claude Haiku 4.5 | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
रिक्वेस्ट और रिस्पॉन्स शेप
Enterprise API OpenAI चैट कम्पलीशन रिक्वेस्ट शेप, Responses API शेप और चयनित मॉडल द्वारा समर्थित होने पर OpenAI इमेज जनरेशन रिक्वेस्ट स्वीकार करती है। स्ट्रीमिंग, टूल, स्ट्रक्चर्ड आउटपुट, टेम्परेचर और मैक्स टोकन नियंत्रण compatible मॉडलों पर पास होते हैं।
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}टूल और कैशिंग
मैनेज्ड एंडपॉइंट OpenAI-compatible टूल कॉल, स्ट्रक्चर्ड आउटपुट, रीज़निंग नियंत्रण, स्ट्रीमिंग चंक और चयनित मॉडल द्वारा समर्थित प्रॉम्प्ट-कैश फील्ड सुरक्षित रखता है। लंबे कोडिंग सत्रों के लिए, कैश नियंत्रणों के साथ स्थिर प्रोजेक्ट कॉन्टेक्स्ट भेजें और एक सुसंगत session ID बनाए रखें।
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'मैनेज्ड कंकरेंसी नियंत्रण
Enterprise API रिक्वेस्ट मॉडल कॉल भेजने से पहले मैनेज्ड एडमिशन कंट्रोल से गुज़रती हैं। गेटवे छोटे वेट क्यू, मॉडल-लेवल कंकरेंसी स्लॉट, अकाउंट-लेवल रिक्वेस्ट-प्रति-मिनट गार्ड, क्षमता टेलीमेट्री और ओवरलोडेड मॉडल पाथ के लिए सर्किट ब्रेकर का उपयोग करता है। ये नियंत्रण केवल Enterprise API ट्रैफिक पर लागू होते हैं और Hypereal रिस्पॉन्स हेडर के रूप में सामने आते हैं।
| सतह | प्राथमिक मॉडल | रिक्वेस्ट | टोकन | क्यू |
|---|---|---|---|---|
| टेक्स्ट जनरेशन | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| इमेज जनरेशन | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
ये मैनेज्ड क्षमता सीमाएं हैं। आंतरिक नियंत्रण के लिए API key खर्च सीमाएं, मॉडल स्कोपिंग, दैनिक बजट, घंटेवार बजट और प्रति-key मॉडल सीमाएं कम कॉन्फ़िगर की जा सकती हैं।
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
धीमी रिक्वेस्ट के लिए स्वचालित मुआवज़ा
Enterprise API रिक्वेस्ट असामान्य रूप से धीमी सफल कॉल के लिए रिक्वेस्ट इंश्योरेंस लेकर आती हैं। विफल रिक्वेस्ट चार्ज नहीं किए जाते, इसलिए मुआवज़े का मूल्यांकन केवल तब होता है जब कोई सफल रिक्वेस्ट credit चार्ज के साथ आती है। नॉन-स्ट्रीमिंग रिस्पॉन्स hypereal.insurance में सेटलमेंट शामिल करती हैं। स्ट्रीमिंग रिस्पॉन्स तुरंत पॉलिसी हेडर एक्सपोज़ करती हैं और स्ट्रीम खत्म होने के बाद स्वचालित रूप से सेटल होती हैं।
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
OpenAI-compatible चैट कम्पलीशन के लिए मैनेज्ड पाथ का उपयोग करें: /v1/managed/chat/completions, Responses API: /v1/managed/responses, और OpenAI इमेज जनरेशन: /v1/managed/images/generations। सीधे Anthropic-native रिक्वेस्ट के लिए /v1/managed/messages का उपयोग करें। Claude Code को अपनी base URL के रूप में https://api.hypereal.cloud का उपयोग करना चाहिए।
