Gateway de IA Empresarial + Plataforma de Computação
Uma chave. Todos os modelos, todas as GPUs, todos os fluxos de trabalho ComfyUI. Com o custo, auditoria e confiabilidade que seu CFO e CTO já perguntaram.
Usado em produção por equipes que entregam recursos de imagem, vídeo, voz e chat para milhões de usuários finais.
Saiba o que você gasta antes da fatura chegar.
Cada solicitação de gateway é precificada, atribuída e registrada em tempo real. Painéis por modelo, previsões mensais e limites de orçamento — prontos para uso, sem necessidade de painel Datadog.
Painel de Custos
Tendência de gastos diários, detalhamento por modelo, 10 solicitações mais caras. A visão que seu CFO realmente pediu.
Previsão de Gastos
Taxa de consumo projetada para o final do mês para que você possa ver os excessos semanas antes que eles atinjam seu cartão.
Alertas de Orçamento
Limite mensal por chave. E-mails em 80% e 100% com um período de espera para que você não receba spam. A pausa automática opcional elimina loops descontrolados.
Webhooks Assinados
Eventos assinados por HMAC para limites de gastos, chave criada, chave revogada, geração falhou. Conecte-os ao PagerDuty, Slack ou seu próprio livro-razão.
Interrupções acontecem. Seus usuários não deveriam notar.
Failover multi-provedor, fallback regional e roteamento ciente da intenção transformam uma dependência frágil de um único fornecedor em uma camada redundante e de autocorreção.
Failover Multi-Provedor
Tempos limite e política de repetição configuráveis por chave. Em caso de 5xx ou tempo limite, o tráfego é transferido transparentemente para o próximo provedor na cadeia.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Roteamento Inteligente
Diga-nos a intenção — chat rápido, raciocínio profundo, edição de imagem, sumarização de texto longo — e nós escolhemos o provedor qualificado mais barato. Fixe um modelo exato quando precisar.
Fallback Regional
Se a região US-East de um provedor estiver degradada, tentamos US-West, depois EU, antes de falhar a solicitação. A aderência à região é configurável por chave.
Controles por chave que satisfazem uma revisão de segurança.
Chaves com escopo, limites de taxa granulares, listas de permissão de IP, log de auditoria imutável e exportação CSV. Projetado para as perguntas que seu CTO e seu auditor farão.
Escopo da Chave de API
Permitir/negar por chave em modelos, lista de permissão de IP, limites diários e horários de gastos. Gire sem reimplantar.
Limites de Taxa por Chave, por Modelo
Limites de RPM e TPM com escopo para a chave e o modelo. Uma chave de staging não pode acidentalmente esgotar a cota de produção.
Log de Auditoria Imutável
Cada chave criada, escopo alterado, orçamento movido ou revogação é registrado com ator, IP e carimbo de data/hora. SOC2-baseline por padrão.
Logs Pesquisáveis + Exportação CSV
Filtre logs de solicitação por endpoint, modelo, status, latência, chave. CSV com um clique para finanças, conformidade ou post-mortem.
Postura de conformidade
- TLS 1.2+ de ponta a ponta. Chaves hash em repouso, nunca registradas em texto simples.
- Isolamento de chave + orçamento por locatário. Sem vazamento de dados entre locatários.
- Retenção de log configurável. Descarte corpos de solicitação sob demanda para cargas de trabalho de alta sensibilidade.
- Roteamento para UE e EUA disponível mediante solicitação para implantações sensíveis à residência de dados.
- Controles SOC2 em escopo para 2026. Entre em contato se precisar de uma carta atual do nosso auditor.
Substituição direta para o SDK do OpenAI. Troque uma URL base.
Hypereal fala OpenAI Chat Completions, Images, Responses e Anthropic Messages. Mantenha seu SDK, seus prompts, suas definições de ferramentas, suas tentativas — mude a URL base e a chave de API, e pronto.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Endpoints suportados
- POST /v1/chat/completions — Compatível com OpenAI
- POST /v1/messages — Compatível com Anthropic
- POST /v1/responses — API de Respostas OpenAI
- POST /v1/images/generations — Compatível com OpenAI
- POST /v1/videos/generate — API de vídeo Hypereal
- POST /v1/comfy/{slug} — Fluxo de trabalho ComfyUI como API
- POST /v1/gpu/{slug} — Passthrough de GPU serverless
Além dos modelos: computação como uma API de primeira classe.
Toda equipe eventualmente precisa de mais do que conclusões de chat — um grafo ComfyUI personalizado, um ajuste fino, um trabalho de GPU único. A Hypereal expõe isso com a mesma chave, os mesmos logs, os mesmos orçamentos.
Passthrough de GPU Serverless
Traga seu próprio manipulador RunPod e chame-o como POST /v1/gpu/{slug}. Nós cuidamos da autenticação, medição, retentativas e da fatura. Você escreve o manipulador.
Fluxo de Trabalho ComfyUI como API
Faça upload de qualquer JSON de fluxo de trabalho ComfyUI. Nós fornecemos um endpoint HTTP versionado com entradas e saídas tipadas, cobrado por execução. Chega de colar grafos no Slack.
Biblioteca ComfyUI
Um catálogo crescente de fluxos de trabalho ComfyUI pré-construídos — restauração de rosto, foto de produto, upscaling cinematográfico — chame-os como qualquer outro modelo.
Repositório de LoRA e Ativos
Armazenamento privado e versionado para LoRAs, checkpoints, embeddings e imagens de referência. Referencie-os por identificador de qualquer fluxo de trabalho ou geração.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Números que publicamos. Não capturas de tela em um deck de vendas.
Página de status ao vivo, latência transparente e um histórico de incidentes que você pode ler sem nos perguntar primeiro.
Página de status pública
Status ao vivo por endpoint e linha do tempo de incidentes.
Ver página de statusLatência transparente
p50 e p95 contínuos para cada endpoint de gateway, por região.
Histórico de uptime
Tempo de atividade dos últimos 30/90 dias, sem truques de marketing. O número é o número.
Pare de usar 8 painéis de fornecedores.
Uma chave de API, uma fatura, um lugar para ver o que está acontecendo. Comece a usar em menos de cinco minutos.

