API корпоративного рівня для програмування та LLM
Використовуйте один Hypereal API key для агентів програмування, інтеграцій з IDE, внутрішніх інструментів і виробничих LLM-навантажень. Enterprise API сумісний з OpenAI, підтримує нативний Anthropic і надає відібраний набір моделей для команд, яким потрібні передбачувані ідентифікатори моделей, генерація зображень, тарифікація та журнали використання.
Ідентифікатори моделей Claude з закінченням -max (наприклад, claude-opus-4-7-max) підтримуються лише через Claude Code CLI до нативного ендпоїнта Anthropic. Використання цих моделей із будь-яким іншим клієнтом або стороннім обгортком суворо заборонено і призведе до блокування запиту та призупинення API key без відшкодування. Це стосується, зокрема, Hermes, OpenClaw та подібних інструментів-проксі, відтворення або пулінгу акаунтів. Стандартні (не -max) моделі не зачіпаються та залишаються доступними для всіх клієнтів.
Використовуйте з Claude Code, агентами програмування, ботами для code review, інструментами IDE та внутрішньою автоматизацією, яка вже підтримує OpenAI або Anthropic API.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen і Kimi доступні за стабільними ідентифікаторами моделей Hypereal.
Генеруйте зображення через той самий керований ендпоїнт завершення чату з полями мультимодальної відповіді та контролем використання на рівні акаунту.
Hypereal API keys зберігають ліміти витрат, область видимості моделей, журнали використання та тарифікацію credits в єдиній площині управління на рівні акаунту.
Успішні запити до Enterprise API включають метадані страхування затримки та автоматичну компенсацію credits при незвично тривалому виконанні.
Виклик завершення чату
Використовуйте керований базовий шлях для відібраного каталогу моделей Enterprise та стабільних ідентифікаторів моделей Hypereal.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Генерація зображень через завершення чату
Використовуйте Nano Banana 2 з мультимодальним завершенням чату або викличте сумісний з OpenAI ендпоїнт генерації зображень для GPT Image 2. Використовуйте ідентифікатори моделей nano-banana-2 та gpt-image-2. Мультимодальні поля зображень у чаті повертають base64 data URL, тоді як генерація зображень повертає структуру відповіді зображення OpenAI.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Використання нативного ендпоїнта Anthropic
Claude Code та клієнти Anthropic SDK мають вказувати на корінь API Hypereal, оскільки вони самостійно додають нативний шлях повідомлень. Прямі HTTP-клієнти можуть звертатися безпосередньо до керованого шляху повідомлень. Використання інструментів, блоки мислення, потокова передача та поля кешу підказок зберігаються.
Ідентифікатори моделей Claude лише для CLI (суфікс -max) мають використовуватися лише з Claude Code CLI. Сторонні обгортки, наприклад Hermes або OpenClaw, на цьому рівні не дозволені.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Підтримувані моделі Enterprise
Ціни вказані за один мільйон токенів і тарифікуються через Hypereal Credits.
| ID моделі | Назва | Контекст | Вхід | Читання кешу | Запис кешу | Вивід |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-6-max | Claude Opus 4.6 (1M) | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-5-max | Claude Opus 4.5 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-sonnet-4-5-max | Claude Sonnet 4.5 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-4-5-max | Claude Haiku 4.5 | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Структура запиту та відповіді
Enterprise API приймає структуру запиту завершення чату OpenAI, структуру Responses API та запити на генерацію зображень OpenAI, якщо вони підтримуються обраною моделлю. Потокова передача, інструменти, структуровані виводи, температура та обмеження максимальної кількості токенів передаються для сумісних моделей.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Інструменти та кешування
Керований ендпоїнт зберігає сумісні з OpenAI виклики інструментів, структуровані виводи, контроль міркувань, фрагменти потокової передачі та поля кешу підказок, що підтримуються обраною моделлю. Для тривалих сеансів програмування надсилайте стабільний контекст проєкту з контролем кешу та зберігайте постійний ідентифікатор сесії.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Керовані контролі паралелізму
Запити до Enterprise API проходять через керований контроль допуску перед відправкою виклику моделі. Шлюз використовує короткі черги очікування, слоти паралелізму на рівні моделі, обмежники кількості запитів за хвилину на рівні акаунту, телеметрію потужності та автоматичні вимикачі для перевантажених шляхів моделі. Ці контролі застосовуються лише до трафіку Enterprise API і відображаються як заголовки відповідей Hypereal.
| Поверхня | Основні моделі | Запити | Токени | Черга |
|---|---|---|---|---|
| Генерація тексту | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Генерація зображень | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Це керовані стелі потужності. Ліміти витрат API key, область видимості моделей, добові й погодинні бюджети та ліміти моделей на ключ можна налаштувати нижче для внутрішнього контролю.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Автоматична компенсація за повільні запити
Запити до Enterprise API мають страхування запитів для незвично повільних успішних викликів. За невдалі запити плата не стягується, тому компенсація оцінюється лише після того, як успішний запит отримав нарахування credits. Відповіді без потокової передачі включають розрахунок у hypereal.insurance. Відповіді з потоковою передачею відразу відкривають заголовки полісу та автоматично розраховуються після завершення потоку.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Використовуйте керований шлях для сумісного з OpenAI завершення чату: /v1/managed/chat/completions, Responses API: /v1/managed/responses та генерації зображень OpenAI: /v1/managed/images/generations. Використовуйте /v1/managed/messages для прямих нативних запитів Anthropic. Claude Code має використовувати https://api.hypereal.cloud як базовий URL.
