Gateway AI aziendale + Piattaforma di calcolo
Una chiave. Ogni modello, ogni GPU, ogni flusso di lavoro ComfyUI. Con i costi, l'audit e l'affidabilità che il vostro CFO e CTO hanno già richiesto.
Utilizzato in produzione da team che distribuiscono funzionalità di immagine, video, voce e chat a milioni di utenti finali.
Sappiate quanto spendete prima che arrivi la fattura.
Ogni richiesta gateway viene prezzata, attribuita e registrata in tempo reale. Dashboard per modello, previsioni mensili e limiti di budget — pronti all'uso, senza bisogno di dashboard Datadog.
Dashboard Costi
Andamento della spesa giornaliera, ripartizione per modello, le 10 richieste più costose. La vista che il vostro CFO ha effettivamente richiesto.
Previsione di Spesa
Tasso di consumo proiettato a fine mese in modo da poter vedere gli sforamenti settimane prima che colpiscano la vostra carta.
Avvisi di Budget
Limite mensile per chiave. Email all'80% e al 100% con un periodo di raffreddamento per non essere sommersi di spam. L'auto-pausa opzionale blocca immediatamente i cicli fuori controllo.
Webhook Firmati
Eventi firmati HMAC per soglie di spesa, chiave creata, chiave revocata, generazione fallita. Collegateli a PagerDuty, Slack o al vostro registro.
Le interruzioni accadono. I vostri utenti non dovrebbero accorgersene.
Il failover multi-provider, il fallback regionale e il routing consapevole dell'intento trasformano una fragile dipendenza da un singolo fornitore in un livello ridondante e auto-riparante.
Failover Multi-Provider
Timeout e policy di retry configurabili per chiave. In caso di 5xx o timeout, il traffico passa in modo trasparente al provider successivo nella catena.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Routing Intelligente
Ci indichi l'intento — chat veloce, ragionamento profondo, modifica immagine, riassunto di testi lunghi — e noi scegliamo il provider qualificato più economico. Fissi un modello esatto quando ne ha bisogno.
Fallback Regionale
Se la regione US-East di un provider è degradata, proviamo US-West, poi EU, prima di far fallire la richiesta. La "region-stickiness" è configurabile per chiave.
Controlli per chiave che soddisfano una revisione di sicurezza.
Chiavi con ambito, limiti di velocità granulari, liste bianche IP, log di audit immutabile ed esportazione CSV. Progettato per le domande che Le porranno sia il Suo CTO che il Suo revisore.
Definizione dell'ambito della Chiave API
Consenti/nega per chiave sui modelli, lista bianca IP, limiti di spesa giornalieri e orari. Ruoti senza ridistribuire.
Limiti di Velocità per Chiave, per Modello
Limiti RPM e TPM con ambito sulla chiave e sul modello. Una chiave di staging non può accidentalmente esaurire la quota di produzione.
Log di Audit Immutabile
Ogni chiave creata, ambito modificato, budget spostato o revoca viene registrato con attore, IP e timestamp. SOC2-baseline per impostazione predefinita.
Log Ricercabili + Esportazione CSV
Filtri i log delle richieste per endpoint, modello, stato, latenza, chiave. CSV con un clic per finanza, conformità o post-mortem.
Posizione di conformità
- TLS 1.2+ end-to-end. Chiavi hashate a riposo, mai registrate in chiaro.
- Isolamento chiave + budget per tenant. Nessuna perdita di dati tra tenant.
- Conservazione dei log configurabile. Elimini i corpi delle richieste su richiesta per carichi di lavoro ad alta sensibilità.
- Routing UE e USA disponibile su richiesta per distribuzioni sensibili alla residenza dei dati.
- Controlli SOC2 in ambito per il 2026. Ci contatti se ha bisogno di una lettera attuale dal nostro revisore.
Sostituzione diretta per l'SDK OpenAI. Scambi un URL di base.
Hypereal parla OpenAI Chat Completions, Images, Responses e Anthropic Messages. Mantenete il vostro SDK, i vostri prompt, le vostre definizioni degli strumenti, i vostri tentativi — cambiate l'URL di base e la chiave API, e siete pronti.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Endpoint supportati
- POST /v1/chat/completions — Compatibile con OpenAI
- POST /v1/messages — Compatibile con Anthropic
- POST /v1/responses — API OpenAI Responses
- POST /v1/images/generations — Compatibile con OpenAI
- POST /v1/videos/generate — API video Hypereal
- POST /v1/comfy/{slug} — Workflow ComfyUI come API
- POST /v1/gpu/{slug} — Passthrough GPU serverless
Oltre i modelli: il compute come API di prima classe.
Ogni team alla fine ha bisogno di più delle chat completions — un grafico ComfyUI personalizzato, un fine-tune, un lavoro GPU una tantum. Hypereal li espone con la stessa chiave, gli stessi log, gli stessi budget.
Passthrough GPU Serverless
Portate il vostro handler RunPod e chiamatelo come POST /v1/gpu/{slug}. Gestiamo autenticazione, misurazione, tentativi e fatturazione. Voi scrivete l'handler.
Workflow ComfyUI come API
Caricate qualsiasi JSON di workflow ComfyUI. Vi forniamo un endpoint HTTP versionato con input e output tipizzati, fatturato per esecuzione. Niente più grafici da incollare in Slack.
Libreria ComfyUI
Un catalogo in crescita di workflow ComfyUI pre-costruiti — ripristino del viso, scatto di prodotto, upscale cinematografico — chiamateli come qualsiasi altro modello.
Repo LoRA e Asset
Archiviazione privata e versionata per LoRA, checkpoint, embedding e immagini di riferimento. Riferitevi a essi tramite handle da qualsiasi workflow o generazione.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Numeri che pubblichiamo. Non screenshot in una presentazione di vendita.
Pagina di stato in tempo reale, latenza trasparente e una cronologia degli incidenti che potete leggere senza chiederci prima.
Pagina di stato pubblica
Stato in tempo reale per endpoint e cronologia degli incidenti.
Visualizza la pagina di statoLatenza trasparente
p50 e p95 continui per ogni endpoint gateway, per regione.
Cronologia dell'uptime
Uptime degli ultimi 30/90 giorni, senza calcoli di marketing. Il numero è il numero.
Smetta di usare 8 dashboard di fornitori diversi.
Una chiave API, un'unica fattura, un solo posto per vedere cosa sta succedendo. Inizi in meno di cinque minuti.

