Plataforma de Cómputo + Gateway de IA Empresarial
Una clave. Cada modelo, cada GPU, cada flujo de trabajo de ComfyUI. Con el costo, la auditoría y la confiabilidad que tu CFO y CTO ya solicitaron.
Utilizado en producción por equipos que entregan funciones de imagen, video, voz y chat a millones de usuarios finales.
Conoce lo que gastas antes de que llegue la factura.
Cada solicitud de gateway tiene un precio, se atribuye y se registra en tiempo real. Paneles por modelo, pronósticos mensuales y límites de presupuesto, listos para usar, sin necesidad de un panel de Datadog.
Panel de Costos
Tendencia de gasto diario, desglose por modelo, las 10 solicitudes más caras. La vista que tu CFO realmente pidió.
Pronóstico de Gasto
Tasa de consumo proyectada hasta fin de mes para que puedas ver los excesos semanas antes de que afecten tu tarjeta.
Alertas de Presupuesto
Límite mensual por clave. Correos electrónicos al 80% y 100% con un tiempo de espera para que no recibas spam. La pausa automática opcional detiene los bucles descontrolados.
Webhooks Firmados
Eventos firmados con HMAC para umbrales de gasto, clave creada, clave revocada, generación fallida. Conéctalos a PagerDuty, Slack o tu propio libro mayor.
Las interrupciones ocurren. Tus usuarios no deberían notarlas.
La conmutación por error de múltiples proveedores, la reserva regional y el enrutamiento consciente de la intención convierten una dependencia frágil de un solo proveedor en una capa redundante y auto-reparable.
Conmutación por Error de Múltiples Proveedores
Tiempos de espera y política de reintentos configurables por clave. En caso de 5xx o tiempo de espera, el tráfico se redirige de forma transparente al siguiente proveedor en la cadena.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Enrutamiento Inteligente
Dinos la intención — chat rápido, razonamiento profundo, edición de imagen, resumen de formato largo — y elegimos el proveedor calificado más económico. Fija un modelo exacto cuando lo necesites.
Respaldo Regional
Si la región US-East de un proveedor está degradada, intentamos US-West, luego EU, antes de que la solicitud falle. La persistencia de región es configurable por clave.
Controles por clave que satisfacen una revisión de seguridad.
Claves con alcance, límites de tasa granulares, listas de IP permitidas, registro de auditoría inmutable y exportación CSV. Diseñado para las preguntas que tu CTO y tu auditor harán.
Alcance de Clave API
Permitir/denegar por clave en modelos, lista de IP permitidas, límites de gasto diarios y por hora. Rota sin volver a implementar.
Límites de Tasa por Clave, por Modelo
Límites de RPM y TPM con alcance a la clave y al modelo. Una clave de staging no puede agotar accidentalmente la cuota de producción.
Registro de Auditoría Inmutable
Cada clave creada, alcance cambiado, presupuesto movido o revocación se registra con actor, IP y marca de tiempo. SOC2-baseline por defecto.
Registros Buscables + Exportación CSV
Filtra registros de solicitudes por endpoint, modelo, estado, latencia, clave. CSV con un clic para finanzas, cumplimiento o post-mortem.
Postura de cumplimiento
- TLS 1.2+ de extremo a extremo. Claves hasheadas en reposo, nunca registradas en texto plano.
- Aislamiento de clave + presupuesto por inquilino. Sin fuga de datos entre inquilinos.
- Retención de registros configurable. Elimina cuerpos de solicitud bajo demanda para cargas de trabajo de alta sensibilidad.
- Enrutamiento en la UE y EE. UU. disponible bajo solicitud para implementaciones sensibles a la residencia de datos.
- Controles SOC2 en alcance para 2026. Contáctanos si necesitas una carta actual de nuestro auditor.
Reemplazo directo para el SDK de OpenAI. Cambia una URL base.
Hypereal habla OpenAI Chat Completions, Images, Responses y Anthropic Messages. Mantén tu SDK, tus prompts, tus definiciones de herramientas, tus reintentos — cambia la URL base y la clave API, y listo.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Puntos finales compatibles
- POST /v1/chat/completions — Compatible con OpenAI
- POST /v1/messages — Compatible con Anthropic
- POST /v1/responses — API de respuestas de OpenAI
- POST /v1/images/generations — Compatible con OpenAI
- POST /v1/videos/generate — API de video de Hypereal
- POST /v1/comfy/{slug} — Flujo de trabajo de ComfyUI como API
- POST /v1/gpu/{slug} — Passthrough de GPU sin servidor
Más allá de los modelos: la computación como API de primera clase.
Todo equipo eventualmente necesita más que completaciones de chat — un gráfico personalizado de ComfyUI, un ajuste fino, un trabajo de GPU único. Hypereal los expone bajo la misma clave, los mismos registros, los mismos presupuestos.
Passthrough de GPU sin servidor
Trae tu propio controlador de RunPod y llámalo como POST /v1/gpu/{slug}. Nosotros nos encargamos de la autenticación, la medición, los reintentos y la factura. Tú escribes el controlador.
Flujo de trabajo de ComfyUI como API
Sube cualquier JSON de flujo de trabajo de ComfyUI. Te damos un punto final HTTP versionado con entradas y salidas tipadas, facturado por ejecución. No más pegar gráficos en Slack.
Biblioteca de ComfyUI
Un catálogo creciente de flujos de trabajo preconstruidos de ComfyUI — restauración facial, toma de producto, mejora cinematográfica — llámalos como cualquier otro modelo.
Repositorio de LoRA y activos
Almacenamiento privado y versionado para LoRAs, puntos de control, incrustaciones e imágenes de referencia. Haz referencia a ellos por su identificador desde cualquier flujo de trabajo o generación.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Números que publicamos. No capturas de pantalla en una presentación de ventas.
Página de estado en vivo, latencia transparente y un historial de incidentes que puedes leer sin preguntarnos primero.
Página de estado pública
Estado en vivo por punto final y cronología de incidentes.
Ver página de estadoLatencia transparente
p50 y p95 rodantes para cada punto final de puerta de enlace, por región.
Historial de tiempo de actividad
Tiempo de actividad de los últimos 30/90 días, sin trucos de marketing. El número es el número.
Deja de usar 8 paneles de proveedores.
Una clave API, una factura, un lugar para ver lo que está pasando. Empieza a funcionar en menos de cinco minutos.

