Enterprise-waardige programmeer- en LLM-API
Gebruik één Hypereal API-sleutel voor programmeeragenten, IDE-integraties, interne tools en productie-LLM-workloads. De Enterprise API is OpenAI-compatibel, Anthropic-native en biedt een geselecteerde modelset voor teams die behoefte hebben aan voorspelbare model-ID's, beeldgeneratie, facturering en gebruikslogboeken.
De CLI-exclusieve Claude-model-ID's die eindigen op -max (bijv. claude-opus-4-7-max) worden alleen ondersteund via de Claude Code CLI via het Anthropic-native eindpunt. Het gebruik van deze modellen met andere clients of wrappers van derden is strikt verboden en leidt tot blokkering van het verzoek en opschorting van de API-sleutel zonder terugbetaling. Dit omvat, maar is niet beperkt tot, Hermes, OpenClaw en vergelijkbare proxy-, replay- of account-pooling-tools. Standaard (niet--max) modellen zijn niet beïnvloed en blijven beschikbaar voor alle clients.
Gebruik het met Claude Code, programmeeragenten, review-bots, IDE-tools en interne automatisering die al werken met OpenAI- of Anthropic-API's.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen en Kimi zijn beschikbaar achter stabiele Hypereal-model-ID's.
Genereer afbeeldingen via hetzelfde beheerde chat completions-eindpunt met multimodale responsvelden en gebruikscontroles op accountniveau.
Hypereal API-sleutels houden bestedingslimieten, modelafbakening, gebruikslogboeken en credits-facturering bijeen in één beheervlak op accountniveau.
Succesvolle Enterprise API-verzoeken bevatten latentieverzekerings-metadata en automatische creditvergoeding wanneer ze ongewoon lang duren.
Chat completions aanroepen
Gebruik het beheerde basispad voor de geselecteerde Enterprise-modelcatalogus en stabiele Hypereal-model-ID's.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Afbeeldingen genereren via chat completions
Gebruik Nano Banana 2 met multimodale chat completions, of roep het OpenAI-compatibele beeldgeneratie-eindpunt aan voor GPT Image 2. Gebruik model-ID's nano-banana-2 en gpt-image-2. Multimodale chat-beeldvelden retourneren base64-data-URL's, terwijl beeldgeneraties de OpenAI-beeldrespons-structuur retourneren.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Het Anthropic-native eindpunt gebruiken
Claude Code en Anthropic SDK-clients dienen te verwijzen naar de Hypereal API-root, omdat ze zelf het native messages-pad toevoegen. Onbewerkte HTTP-clients kunnen het beheerde messages-pad rechtstreeks aanroepen. Toolgebruik, denkblokken, streaming en prompt-cachevelden blijven behouden.
De CLI-exclusieve Claude-model-ID's (-max-achtervoegsel) mogen alleen worden gebruikt vanuit de Claude Code CLI. Wrappers van derden zoals Hermes of OpenClaw zijn niet toegestaan op dit niveau.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Ondersteunde Enterprise-modellen
Prijzen worden weergegeven per miljoen tokens en gefactureerd via Hypereal Credits.
| Model-ID | Naam | Context | Invoer | Cache lezen | Cache schrijven | Uitvoer |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-6-max | Claude Opus 4.6 (1M) | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-5-max | Claude Opus 4.5 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-sonnet-4-5-max | Claude Sonnet 4.5 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-4-5-max | Claude Haiku 4.5 | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Structuur van verzoek en respons
De Enterprise API accepteert de OpenAI-chat completions-verzoekstructuur, de Responses API-structuur en OpenAI-beeldgeneratieverzoeken indien ondersteund door het geselecteerde model. Streaming, tools, gestructureerde uitvoer, temperatuur en maximale tokenbesturing worden doorgegeven op compatibele modellen.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Tools en caching
Het beheerde eindpunt behoudt OpenAI-compatibele tool calls, gestructureerde uitvoer, redeneerbesturing, streaming-chunks en prompt-cachevelden die worden ondersteund door het geselecteerde model. Stuur voor lange programmeersessies stabiele projectcontext mee met cache-besturing en behoud een consistent sessie-ID.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Beheerde gelijktijdigheidsbesturing
Enterprise API-verzoeken doorlopen beheerde toelatingsbeheer voordat een modelaanroep wordt verzonden. De gateway maakt gebruik van korte wachtrijen, gelijktijdigheidsslots op modelniveau, bewakingsinstructies per minuut op accountniveau, capaciteitstelemetrie en stroomonderbrekers voor overbelaste modelpaden. Deze besturingen gelden alleen voor Enterprise API-verkeer en worden weergegeven als Hypereal-responsheaders.
| Oppervlak | Primaire modellen | Verzoeken | Tokens | Wachtrij |
|---|---|---|---|---|
| Tekstgeneratie | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Beeldgeneratie | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Dit zijn beheerde capaciteitsplafonds. Bestedingslimieten voor API-sleutels, modelafbakening, dagelijkse budgetten, uurbudgetten en modellimieten per sleutel kunnen lager worden ingesteld voor interne besturing.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Automatische vergoeding voor trage verzoeken
Enterprise API-verzoeken hebben verzoeksverzekering voor ongewoon trage succesvolle aanroepen. Mislukte verzoeken worden niet in rekening gebracht, dus vergoeding wordt alleen beoordeeld nadat een succesvol verzoek een creditbelasting heeft ontvangen. Niet-streamende antwoorden bevatten de afrekening in hypereal.insurance. Streamende antwoorden tonen direct beleidsheaders en rekenen automatisch af nadat de stream is voltooid.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Gebruik het beheerde pad voor OpenAI-compatibele chat completions: /v1/managed/chat/completions, Responses API: /v1/managed/responses, en OpenAI-beeldgeneraties: /v1/managed/images/generations. Gebruik /v1/managed/messages voor directe Anthropic-native verzoeken. Claude Code dient https://api.hypereal.cloud als basis-URL te gebruiken.
