Корпоративен API за програмиране и LLM от enterprise ниво
Използвайте един Hypereal API ключ за агенти за програмиране, IDE интеграции, вътрешни инструменти и производствени LLM натоварвания. Enterprise API е OpenAI-съвместим, Anthropic-нативен и предоставя подбран набор от модели за екипи, които желаят предвидими идентификатори на модели, генериране на изображения, фактуриране и журнали на използването.
Идентификаторите на Claude модели, завършващи на -max (напр. claude-opus-4-7-max), се поддържат само чрез Claude Code CLI срещу Anthropic-нативния крайна точка. Използването на тези модели с друг клиент или обвивка на трета страна е строго забранено и ще доведе до блокиране на заявката и спиране на API ключа без възстановяване. Това включва, но не се ограничава до, Hermes, OpenClaw и подобни инструменти за прокси, повторно възпроизвеждане или обединяване на акаунти. Стандартните (не--max) модели не са засегнати и остават достъпни за всички клиенти.
Използвайте го с Claude Code, агенти за програмиране, ботове за преглед на код, IDE инструменти и вътрешна автоматизация, която вече говори OpenAI или Anthropic APIs.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen и Kimi са достъпни зад стабилни Hypereal идентификатори на модели.
Генерирайте изображения чрез същата управлявана крайна точка за чат завършвания с мултимодални полета за отговор и контроли за използване на ниво акаунт.
Hypereal API ключовете съхраняват лимити за разходи, обхват на модели, журнали на използването и кредитно фактуриране в един контролен панел на ниво акаунт.
Успешните Enterprise API заявки включват метаданни за застраховка на латентността и автоматична кредитна компенсация при необичайно дълго изпълнение.
Извикване на чат завършвания
Използвайте управлявания базов път за подбрания каталог с Enterprise модели и стабилни Hypereal идентификатори на модели.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Генерирайте изображения чрез чат завършвания
Използвайте Nano Banana 2 с мултимодални чат завършвания или извикайте OpenAI-съвместимата крайна точка за генериране на изображения за GPT Image 2. Използвайте идентификатори на модели nano-banana-2 и gpt-image-2. Мултимодалните полета за изображения в чата връщат base64 URL адреси на данни, докато генерирането на изображения връща формата на отговор за изображения на OpenAI.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Използване на Anthropic-нативната крайна точка
Claude Code и клиентите на Anthropic SDK трябва да сочат към корена на Hypereal API, тъй като те сами добавят нативния path за съобщения. Raw HTTP клиентите могат директно да извикват управлявания path за съобщения. Извикването на инструменти, блоковете за мислене, поточното предаване и полетата за кеш на подканите се запазват.
Идентификаторите на Claude модели само за CLI (суфикс -max) трябва да се използват само от Claude Code CLI. Обвивки на трети страни като Hermes или OpenClaw не са разрешени на това ниво.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Поддържани Enterprise модели
Цените са показани за един милион токени и се таксуват чрез Hypereal Credits.
| Идентификатор на модел | Наименование | Контекст | Входящи | Четене от кеш | Запис в кеш | Изходящи |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Форма на заявка и отговор
Enterprise API приема формата на заявка за чат завършвания на OpenAI, формата на Responses API и заявки за генериране на изображения на OpenAI, когато се поддържат от избрания модел. Поточното предаване, инструментите, структурираните изходни данни, температурата и контролите за максимален брой токени преминават прозрачно при съвместими модели.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Инструменти и кеширане
Управляваната крайна точка запазва OpenAI-съвместимите извиквания на инструменти, структурираните изходни данни, контролите за разсъждение, поточните парчета и полетата за кеш на подканите, поддържани от избрания модел. За дълги сесии за програмиране изпращайте стабилен контекст на проекта с контроли за кеш и поддържайте последователен идентификатор на сесията.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Управлявани контроли на конкурентност
Enterprise API заявките преминават през управляван контрол на допускане преди изпращане на извикване към модела. Шлюзът използва кратки опашки за изчакване, слотове за конкурентност на ниво модел, охрани за заявки в минута на ниво акаунт, телеметрия на капацитета и автоматични прекъсвачи за претоварени пътища на модели. Тези контроли се прилагат само за Enterprise API трафик и се представят като Hypereal заглавки на отговора.
| Повърхност | Основни модели | Заявки | Токени | Опашка |
|---|---|---|---|---|
| Генериране на текст | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Генериране на изображения | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Това са управлявани тавани на капацитета. Лимитите за разходи на API ключ, обхватът на модели, дневните бюджети, почасовите бюджети и ограниченията на модели за ключ могат да бъдат конфигурирани по-ниско за вътрешен контрол.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Автоматична компенсация за бавни заявки
Enterprise API заявките носят застраховка за необичайно бавни успешни извиквания. Неуспешните заявки не се таксуват, така че компенсацията се оценява само след като успешна заявка е натрупала кредитна такса. Отговорите без поточно предаване включват уреждането в hypereal.insurance. Отговорите с поточно предаване излагат заглавките на политиката незабавно и уреждат автоматично след приключване на потока.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Използвайте управлявания path за OpenAI-съвместими чат завършвания: /v1/managed/chat/completions, Responses API: /v1/managed/responses и генериране на изображения на OpenAI: /v1/managed/images/generations. Използвайте /v1/managed/messages за директни Anthropic-нативни заявки. Claude Code трябва да използва https://api.hypereal.cloud като свой базов URL.
