Enterprise API za kodiranje i LLM enterprise razine
Koristite jedan Hypereal API ključ za agente za kodiranje, integracije IDE-a, interne alate i produkcijske LLM radne tokove. Enterprise API je OpenAI-kompatibilan, Anthropic-native, i izlaže kuriran skup modela za timove koji žele predvidljive ID-ove modela, generiranje slika, naplatu i zapise korištenja.
ID-ovi Claude modela koji završavaju na -max (npr. claude-opus-4-7-max) podržani su samo putem Claude Code CLI na Anthropic-native krajnjoj točki. Korištenje ovih modela s bilo kojim drugim klijentom ili omotačem treće strane strogo je zabranjeno i rezultirat će blokiranjem zahtjeva i suspenzijom API ključa bez povrata. To uključuje, ali nije ograničeno na, Hermes, OpenClaw i slične alate za proxying, reprodukciju ili agregaciju računa. Standardni (ne--max) modeli nisu pogođeni i ostaju dostupni svim klijentima.
Koristite ga s Claude Code, agentima za kodiranje, botovima za pregled, alatima za IDE i internom automatizacijom koja već govori OpenAI ili Anthropic API-je.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen i Kimi izloženi su iza stabilnih Hypereal ID-ova modela.
Generirajte slike putem iste upravljane krajnje točke za dovršavanje razgovora s multimodalnim poljem odgovora i kontrolama korištenja na razini računa.
Hypereal API ključevi drže limite potrošnje, opseg modela, zapise korištenja i naplatu credits u jednoj kontrolnoj ravni na razini računa.
Uspješni Enterprise API zahtjevi uključuju metapodatke o osiguranju latencije i automatsku kompenzaciju credits kada traju neobično dugo.
Pozovite dovršavanje razgovora
Koristite upravljanu baznu putanju za kuriran Enterprise katalog modela i stabilne Hypereal ID-ove modela.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Generirajte slike putem dovršavanja razgovora
Koristite Nano Banana 2 s multimodalnim dovršavanjem razgovora ili pozovite OpenAI-kompatibilnu krajnju točku za generiranje slika za GPT Image 2. Koristite ID-ove modela nano-banana-2 i gpt-image-2. Multimodalna polja slike u razgovoru vraćaju base64 URL-ove podataka, dok generiranje slika vraća OpenAI oblik odgovora za slike.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Koristite Anthropic-native krajnju točku
Claude Code i Anthropic SDK klijenti trebaju pokazati na korijen Hypereal API-ja jer sami dodaju nativnu putanju poruka. Sirovi HTTP klijenti mogu izravno pozivati upravljanu putanju poruka. Korištenje alata, blokovi razmišljanja, strujanje i polja predmemorije promptova su sačuvani.
CLI-only ID-ovi Claude modela (sufiks -max) smiju se koristiti samo iz Claude Code CLI. Omotači trećih strana kao što su Hermes ili OpenClaw nisu dopušteni na ovom nivou.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Podržani Enterprise modeli
Cijene su prikazane po milijunu tokena i naplaćuju se putem Hypereal Credits.
| ID modela | Naziv | Kontekst | Ulaz | Čitanje predmemorije | Pisanje predmemorije | Izlaz |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-6-max | Claude Opus 4.6 (1M) | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-5-max | Claude Opus 4.5 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-sonnet-4-5-max | Claude Sonnet 4.5 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-4-5-max | Claude Haiku 4.5 | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Oblik zahtjeva i odgovora
Enterprise API prihvaća oblik zahtjeva za dovršavanje OpenAI razgovora, oblik Responses API-ja i zahtjeve za generiranje OpenAI slika kad ih odabrani model podržava. Strujanje, alati, strukturirani izlazi, temperatura i kontrole maksimalnog broja tokena prolaze kroz kompatibilne modele.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Alati i predmemorija
Upravljana krajnja točka čuva OpenAI-kompatibilne pozive alata, strukturirane izlaze, kontrole zaključivanja, dijelove strujanja i polja predmemorije promptova koje podržava odabrani model. Za dugačke sesije kodiranja, šaljite stabilan kontekst projekta s kontrolama predmemorije i zadržite dosljedan ID sesije.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Upravljane kontrole istovremenih zahtjeva
Enterprise API zahtjevi prolaze kroz upravljanu kontrolu prihvata prije nego što se pošalje poziv modelu. Pristupnik koristi kratke čekaonice, slotove istovremenih zahtjeva na razini modela, zaštitu zahtjeva po minuti na razini računa, telemetriju kapaciteta i prekidače strujnog kruga za preopterećene putanje modela. Te kontrole primjenjuju se samo na Enterprise API promet i prikazuju se kao Hypereal zaglavlja odgovora.
| Površina | Primarni modeli | Zahtjevi | Tokeni | Red čekanja |
|---|---|---|---|---|
| Generiranje teksta | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Generiranje slika | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Ovo su upravljani stropovi kapaciteta. Limiti potrošnje API ključeva, opseg modela, dnevni proračuni, satni proračuni i limiti modela po ključu mogu se konfigurirati niže za internu kontrolu.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Automatska kompenzacija za spore zahtjeve
Enterprise API zahtjevi nose osiguranje zahtjeva za neobično spore uspješne pozive. Neuspješni zahtjevi se ne naplaćuju, pa se kompenzacija procjenjuje samo nakon što uspješan zahtjev ima naknadu credits. Nestrujni odgovori uključuju namirenje u hypereal.insurance. Odgovori strujanjem odmah izlažu zaglavlja police i automatski se namiruju nakon što strujanje završi.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Koristite upravljanu putanju za OpenAI-kompatibilno dovršavanje razgovora: /v1/managed/chat/completions, Responses API: /v1/managed/responses, i OpenAI generiranje slika: /v1/managed/images/generations. Koristite /v1/managed/messages za izravne Anthropic-native zahtjeve. Claude Code treba koristiti https://api.hypereal.cloud kao bazni URL.
