API enterprise-grade pentru codare și LLM
Folosește o singură cheie API Hypereal pentru agenți de codare, integrări IDE, instrumente interne și sarcini de lucru LLM în producție. Enterprise API este compatibil OpenAI, nativ Anthropic și expune un set de modele selecționat pentru echipele care doresc ID-uri de model previzibile, generare de imagini, facturare și jurnale de utilizare.
ID-urile de model Claude care se termină cu -max (ex. claude-opus-4-7-max) sunt acceptate exclusiv prin CLI-ul Claude Code la endpointul nativ Anthropic. Utilizarea acestor modele cu orice alt client sau intermediar terț este strict interzisă și va duce la blocarea cererii și suspendarea cheii API fără rambursare. Aceasta include, dar nu se limitează la, Hermes, OpenClaw și instrumente similare de proxy, replay sau grupare de conturi. Modelele standard (non--max) nu sunt afectate și rămân disponibile pentru toți clienții.
Folosește-l cu Claude Code, agenți de codare, boți de revizuire, instrumente IDE și automatizări interne care comunică deja cu API-urile OpenAI sau Anthropic.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen și Kimi sunt expuse în spatele unor ID-uri de model Hypereal stabile.
Generează imagini prin același endpoint gestionat de chat completions, cu câmpuri de răspuns multimodal și controale de utilizare la nivel de cont.
Cheile API Hypereal mențin limitele de cheltuieli, modelele permise, jurnalele de utilizare și facturarea prin credits într-un singur plan de control la nivel de cont.
Cererile Enterprise API reușite includ metadate de asigurare a latenței și compensare automată prin credits atunci când durează neobișnuit de mult.
Apelează chat completions
Folosește calea de bază gestionată pentru catalogul de modele Enterprise selecționat și ID-urile de model Hypereal stabile.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Generează imagini prin chat completions
Folosește Nano Banana 2 cu chat completions multimodal, sau apelează endpointul de generare imagini compatibil OpenAI pentru GPT Image 2. Folosește ID-urile de model nano-banana-2 și gpt-image-2. Câmpurile de imagini din chat multimodal returnează URL-uri de date base64, iar image generations returnează forma de răspuns OpenAI.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Folosește endpointul nativ Anthropic
Claude Code și clienții SDK Anthropic ar trebui să indice rădăcina API Hypereal, deoarece aceștia adaugă ei înșiși calea nativă de mesaje. Clienții HTTP simpli pot apela direct calea gestionată de mesaje. Utilizarea de instrumente, blocurile de gândire, streaming-ul și câmpurile cache de prompt sunt păstrate.
ID-urile de model Claude exclusiv CLI (sufixul -max) trebuie utilizate doar din CLI-ul Claude Code. Intermediarii terți precum Hermes sau OpenClaw nu sunt permiși pe acest nivel.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Modele Enterprise acceptate
Prețurile sunt afișate per un milion de tokeni și facturate prin Hypereal Credits.
| ID model | Nume | Context | Intrare | Citire cache | Scriere cache | Ieșire |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Forma cererii și a răspunsului
Enterprise API acceptă forma cererii chat completions OpenAI, forma Responses API și cererile de generare imagini OpenAI atunci când sunt acceptate de modelul selectat. Streaming, instrumente, rezultate structurate, temperatură și controale maxime de tokeni trec prin modele compatibile.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Instrumente și caching
Endpointul gestionat păstrează apelurile de instrumente compatibile OpenAI, rezultatele structurate, controalele de raționament, fragmentele de streaming și câmpurile cache de prompt acceptate de modelul selectat. Pentru sesiuni lungi de codare, trimite un context de proiect stabil cu controale cache și menține un ID de sesiune consistent.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Controale de concurență gestionate
Cererile Enterprise API trec printr-un control de admisie gestionat înainte ca un apel de model să fie trimis. Gateway-ul folosește cozi scurte de așteptare, sloturi de concurență la nivel de model, garduri de cereri-pe-minut la nivel de cont, telemetrie a capacității și întrerupătoare de circuit pentru căile de model supraîncărcate. Aceste controale se aplică exclusiv traficului Enterprise API și sunt expuse ca anteturi de răspuns Hypereal.
| Suprafață | Modele primare | Cereri | Tokeni | Coadă |
|---|---|---|---|---|
| Generare text | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Generare imagini | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Acestea sunt plafoane de capacitate gestionate. Limitele de cheltuieli ale cheilor API, modelele permise, bugetele zilnice, bugetele orare și limitele de model per cheie pot fi configurate la valori mai mici pentru control intern.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Compensare automată pentru cereri lente
Cererile Enterprise API includ asigurare pentru apeluri reușite neobișnuit de lente. Cererile eșuate nu sunt taxate, deci compensarea este evaluată doar după ce o cerere reușită a generat o taxă de credits. Răspunsurile non-streaming includ decontarea în hypereal.insurance. Răspunsurile de streaming expun imediat anteturile de politică și se decontează automat după ce stream-ul se termină.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Folosește calea gestionată pentru chat completions compatibile OpenAI: /v1/managed/chat/completions, Responses API: /v1/managed/responses, și generare imagini OpenAI: /v1/managed/images/generations. Folosește /v1/managed/messages pentru cereri native Anthropic directe. Claude Code ar trebui să folosească https://api.hypereal.cloud ca URL de bază.
