API de LLM y código de nivel empresarial
Usa una sola API key de Hypereal para agentes de código, integraciones IDE, herramientas internas y cargas de trabajo LLM en producción. La Enterprise API es compatible con OpenAI, nativa de Anthropic, y expone un conjunto de modelos curado para equipos que desean IDs de modelo predecibles, generación de imágenes, facturación y registros de uso.
Los IDs de modelo de Claude exclusivos del CLI que terminan en -max (p. ej. claude-opus-4-7-max) solo son compatibles a través del CLI de Claude Code contra el endpoint nativo de Anthropic. El uso de estos modelos con cualquier otro cliente o wrapper de terceros está estrictamente prohibido y resultará en el bloqueo de la solicitud y la suspensión de la API key sin reembolso. Esto incluye, entre otros, Hermes, OpenClaw y herramientas similares de proxy, reproducción o agrupación de cuentas. Los modelos estándar (sin sufijo -max) no se ven afectados y permanecen disponibles para todos los clientes.
Úsalo con Claude Code, agentes de código, bots de revisión, herramientas IDE y automatización interna que ya hablan las API de OpenAI o Anthropic.
Claude Opus 4.8, Claude Sonnet 4.7, Claude Haiku, GPT-5.5, Nano Banana 2, GPT Image 2, DeepSeek, Qwen y Kimi están disponibles detrás de IDs de modelo estables de Hypereal.
Genera imágenes a través del mismo endpoint de chat completions gestionado con campos de respuesta multimodal y controles de uso a nivel de cuenta.
Las API keys de Hypereal mantienen límites de gasto, alcance de modelos, registros de uso y facturación de credits en un único plano de control a nivel de cuenta.
Las solicitudes exitosas de la Enterprise API incluyen metadatos de seguro de latencia y compensación automática de credits cuando tardan más de lo habitual.
Llamar a chat completions
Usa la ruta base gestionada para el catálogo de modelos Enterprise curado y los IDs de modelo estables de Hypereal.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Review this TypeScript function for correctness."
}
],
"temperature": 0.2,
"max_tokens": 1200
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1/managed",
});
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [
{ role: "user", content: "Write a migration checklist for this PR." },
],
});
console.log(completion.choices[0]?.message?.content);const response = await client.responses.create({
model: "claude-sonnet-4-7",
input: "Create a concise migration checklist for this pull request.",
});
console.log(response.output_text);Genera imágenes a través de chat completions
Usa Nano Banana 2 con chat completions multimodal, o llama al endpoint de generación de imágenes compatible con OpenAI para GPT Image 2. Usa los IDs de modelo nano-banana-2 y gpt-image-2. Los campos de imagen de chat multimodal devuelven URLs de datos en base64, mientras que la generación de imágenes devuelve la forma de respuesta de imagen de OpenAI.
curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-2",
"messages": [
{
"role": "user",
"content": "Generate a clean product mockup of a glass banana sculpture on a white studio background."
}
],
"modalities": ["image", "text"],
"image_config": {
"aspect_ratio": "1:1",
"image_size": "1K"
}
}'curl https://api.hypereal.cloud/v1/managed/images/generations \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A clean product mockup of a glass banana sculpture on a white studio background.",
"size": "1024x1024",
"quality": "standard"
}'Usar el endpoint nativo de Anthropic
Claude Code y los clientes del SDK de Anthropic deben apuntar a la raíz de la API de Hypereal porque añaden ellos mismos la ruta de mensajes nativa. Los clientes HTTP puros pueden llamar directamente a la ruta de mensajes gestionada. El uso de herramientas, los bloques de pensamiento, el streaming y los campos de caché de prompts se conservan.
Los IDs de modelo de Claude exclusivos del CLI (sufijo -max) solo deben usarse desde el CLI de Claude Code. Los wrappers de terceros como Hermes u OpenClaw no están permitidos en este nivel.
export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-8" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-7" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-latest" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-7"
# Claude Code CLI ONLY. # Claude model IDs for the official Claude Code CLI, not third-party wrappers. export ANTHROPIC_BASE_URL="https://api.hypereal.cloud" export ANTHROPIC_AUTH_TOKEN="ck_..." export ANTHROPIC_API_KEY="" export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-7-max" export ANTHROPIC_DEFAULT_SONNET_MODEL="claude-sonnet-4-6-max" export ANTHROPIC_DEFAULT_HAIKU_MODEL="claude-haiku-4-5-max" export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-6-max"
curl https://api.hypereal.cloud/v1/managed/messages \
-H "anthropic-api-key: ck_..." \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Review this diff." }
],
"tools": [],
"max_tokens": 1200
}'Modelos Enterprise compatibles
Los precios se muestran por millón de tokens y se facturan mediante Hypereal Credits.
| ID de modelo | Nombre | Contexto | Entrada | Lectura de caché | Escritura de caché | Salida |
|---|---|---|---|---|---|---|
| claude-opus-4-8 | Claude Opus 4.8 | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-7 | Claude Sonnet 4.7 | 1M | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-latest | Claude Haiku Latest | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| claude-opus-4-7-max | Claude Opus 4.7 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-6-max | Claude Opus 4.6 (1M) | 1M | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-opus-4-5-max | Claude Opus 4.5 | 200k | $5.25 | $0.525 | $6.56 | $26.25 |
| claude-sonnet-4-6-max | Claude Sonnet 4.6 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-sonnet-4-5-max | Claude Sonnet 4.5 | 200k | $3.15 | $0.315 | $3.94 | $15.75 |
| claude-haiku-4-5-max | Claude Haiku 4.5 | 200k | $1.05 | $0.105 | $1.31 | $5.25 |
| gpt-5-5 | GPT-5.5 | 1M | $5.25 | $0.525 | n/a | $31.50 |
| deepseek-v4-pro | DeepSeek V4 Pro | 1M | $0.4567 | $0.0038 | n/a | $0.9135 |
| qwen3-7-max | Qwen3.7 Max | 200k | $1.31 | $0.2625 | $1.64 | $3.94 |
| qwen3-7-plus | Qwen3.7 Plus | 1M | $0.42 | $0.084 | $0.525 | $1.68 |
| kimi-latest | Kimi Latest | 256k | $0.7182 | $0.1512 | n/a | $3.59 |
| nano-banana-2 | Nano Banana 2 | 131k | $0.525 | n/a | n/a | $3.15 |
| gpt-image-2 | GPT Image 2 | 272k | $8.40 | $2.10 | n/a | $31.50 |
curl https://api.hypereal.cloud/v1/managed/models \ -H "Authorization: Bearer ck_..."
Forma de solicitud y respuesta
La Enterprise API acepta la forma de solicitud de chat completions de OpenAI, la forma de la Responses API y las solicitudes de generación de imágenes de OpenAI cuando el modelo seleccionado lo admite. El streaming, las herramientas, las salidas estructuradas, la temperatura y los controles de tokens máximos se transmiten en los modelos compatibles.
{
"model": "claude-sonnet-4-7",
"messages": [
{ "role": "user", "content": "Refactor this function." }
],
"stream": true,
"max_tokens": 2000
}{
"hypereal": {
"billing": {
"model": "claude-sonnet-4-7",
"credits_charged": 12,
"balance_before": 1000,
"balance_after": 988
}
}
}Herramientas y caché
El endpoint gestionado conserva las llamadas a herramientas compatibles con OpenAI, las salidas estructuradas, los controles de razonamiento, los fragmentos de streaming y los campos de caché de prompts admitidos por el modelo seleccionado. Para sesiones de código prolongadas, envía contexto de proyecto estable con controles de caché y mantén un ID de sesión coherente.
const completion = await client.chat.completions.create({
model: "claude-sonnet-4-7",
messages: [{ role: "user", content: "Find the changed files." }],
tools: [
{
type: "function",
function: {
name: "list_changed_files",
description: "List changed files in the current repository.",
parameters: { type: "object", properties: {} },
},
},
],
tool_choice: "auto",
});curl https://api.hypereal.cloud/v1/managed/chat/completions \
-H "Authorization: Bearer ck_..." \
-H "Content-Type: application/json" \
-H "X-Hypereal-Cache: true" \
-H "X-Session-Id: coding-agent-session-123" \
-d '{
"model": "claude-sonnet-4-7",
"cache_control": { "type": "ephemeral" },
"messages": [
{ "role": "system", "content": "Stable project context..." },
{ "role": "user", "content": "Continue the refactor." }
],
"max_tokens": 1200
}'Controles de concurrencia gestionados
Las solicitudes de la Enterprise API pasan por un control de admisión gestionado antes de enviar una llamada al modelo. La pasarela usa colas de espera cortas, ranuras de concurrencia a nivel de modelo, guardias de solicitudes por minuto a nivel de cuenta, telemetría de capacidad y disyuntores para rutas de modelo sobrecargadas. Estos controles se aplican solo al tráfico de la Enterprise API y se exponen como cabeceras de respuesta de Hypereal.
| Superficie | Modelos principales | Solicitudes | Tokens | Cola |
|---|---|---|---|---|
| Generación de texto | gpt-5-5 | 15,000 RPM | 40,000,000 TPM | 15,000,000,000 tokens |
| Generación de imágenes | gpt-image-2 | 250 IPM | 8,000,000 TPM | n/a |
Estos son los límites de capacidad gestionada. Los límites de gasto de API key, el alcance de modelos, los presupuestos diarios, los presupuestos por hora y los límites de modelo por key pueden configurarse a valores más bajos para control interno.
X-Hypereal-Managed-Governor: active X-Hypereal-Managed-Model-Concurrency-Limit: 80 X-Hypereal-Managed-Model-Concurrency-Remaining: 79 X-Hypereal-Managed-Model-RPM-Limit: 15000 X-Hypereal-Managed-Model-RPM-Remaining: 14999 X-Hypereal-Capacity-Requests-Remaining: 9852 X-Hypereal-Managed-Image-IPM-Limit: 250 X-Hypereal-Managed-Image-IPM-Remaining: 249 X-Hypereal-Managed-Circuit: closed
Compensación automática por solicitudes lentas
Las solicitudes de la Enterprise API incluyen un seguro de solicitud para llamadas exitosas inusualmente lentas. Las solicitudes fallidas no se cobran, por lo que la compensación solo se evalúa después de que una solicitud exitosa haya generado un cargo de credits. Las respuestas sin streaming incluyen la liquidación en hypereal.insurance. Las respuestas en streaming exponen las cabeceras de política de forma inmediata y se liquidan automáticamente tras finalizar el stream.
{
"hypereal": {
"insurance": {
"status": "paid",
"trigger": "latency",
"reason": "latency_threshold_exceeded",
"latency_ms": 94320,
"threshold_ms": 90000,
"credits_charged": 12,
"credits_compensated": 3
}
}
}X-Hypereal-Insurance-Status: paid X-Hypereal-Insurance-Trigger: latency X-Hypereal-Insurance-Latency-Ms: 94320 X-Hypereal-Insurance-Threshold-Ms: 90000 X-Hypereal-Insurance-Credits: 3
Usa la ruta gestionada para chat completions compatibles con OpenAI: /v1/managed/chat/completions, Responses API: /v1/managed/responses, y generación de imágenes de OpenAI: /v1/managed/images/generations. Usa /v1/managed/messages para solicitudes nativas de Anthropic directas. Claude Code debe usar https://api.hypereal.cloud como su base URL.
