청구서가 도착하기 전에 지출을 파악하세요.
모든 게이트웨이 요청은 실시간으로 가격이 책정되고, 귀속되며, 기록됩니다. 모델별 대시보드, 월별 예측, 예산 보호 장치가 기본으로 제공되며, Datadog 대시보드는 필요하지 않습니다.
비용 대시보드
일일 지출 추세, 모델별 분석, 가장 비싼 요청 상위 10개. CFO가 실제로 요청했던 보기입니다.
지출 예측
월말까지의 소진율을 예측하여 카드에 청구되기 몇 주 전에 초과 지출을 확인할 수 있습니다.
예산 알림
키별 월별 한도. 스팸을 방지하기 위한 유예 기간과 함께 80% 및 100% 도달 시 이메일이 발송됩니다. 선택적 자동 일시 중지 기능은 폭주하는 루프를 즉시 중단시킵니다.
서명된 웹훅
지출 임계값, 키 생성, 키 해지, 생성 실패에 대한 HMAC 서명 이벤트. PagerDuty, Slack 또는 자체 원장에 연결하세요.
서비스 중단은 발생할 수 있습니다. 하지만 사용자는 알아채지 못해야 합니다.
다중 공급자 장애 조치, 지역별 대체, 의도 인식 라우팅을 통해 취약한 단일 공급업체 종속성을 중복되고 자가 치유되는 계층으로 전환합니다.
다중 공급자 장애 조치
키별 시간 초과 및 재시도 정책을 구성할 수 있습니다. 5xx 오류 또는 시간 초과 시 트래픽은 체인의 다음 공급자로 투명하게 전환됩니다.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
스마트 라우팅
빠른 채팅, 심층 추론, 이미지 편집, 장문 요약 등 의도를 알려주시면 가장 저렴하고 적합한 공급자를 선택해 드립니다. 필요한 경우 정확한 모델을 고정할 수 있습니다.
지역별 대체
공급자의 미국 동부(US-East) 지역이 저하되면 요청 실패 전에 미국 서부(US-West), 그 다음 EU를 시도합니다. 지역 고정은 키별로 구성할 수 있습니다.
보안 검토를 만족시키는 키별 제어 기능.
범위가 지정된 키, 세분화된 속도 제한, IP 허용 목록, 변경 불가능한 감사 로그 및 CSV 내보내기. CTO와 감사관 모두가 질문할 내용에 맞춰 설계되었습니다.
API 키 범위 지정
모델별 허용/거부, IP 허용 목록, 일별 및 시간별 지출 상한선. 재배포 없이 순환할 수 있습니다.
키별, 모델별 속도 제한
RPM 및 TPM 제한은 키와 모델에 따라 범위가 지정됩니다. 스테이징 키가 실수로 프로덕션의 할당량을 소진할 수 없습니다.
변경 불가능한 감사 로그
생성된 모든 키, 변경된 범위, 이동된 예산 또는 취소는 행위자, IP 및 타임스탬프와 함께 기록됩니다. 기본적으로 SOC2 기준을 따릅니다.
검색 가능한 로그 + CSV 내보내기
엔드포인트, 모델, 상태, 대기 시간, 키별로 요청 로그를 필터링합니다. 재무, 규정 준수 또는 사후 분석을 위한 원클릭 CSV 내보내기.
규정 준수 상태
- 종단 간 TLS 1.2+ 지원. 키는 저장 시 해시되며, 일반 텍스트로 기록되지 않습니다.
- 테넌트별 키 + 예산 격리. 테넌트 간 데이터 유출이 없습니다.
- 구성 가능한 로그 보존. 고감도 워크로드의 경우 요청 본문을 필요에 따라 삭제할 수 있습니다.
- 데이터 상주에 민감한 배포를 위해 EU 및 미국 라우팅을 요청 시 이용할 수 있습니다.
- 2026년 SOC2 제어 범위에 포함됩니다. 현재 감사관의 서신이 필요하시면 문의해 주세요.
OpenAI SDK를 위한 드롭인. 기본 URL 하나만 바꾸면 됩니다.
Hypereal은 OpenAI Chat Completions, Images, Responses, Anthropic Messages를 지원합니다. SDK, 프롬프트, 도구 정의, 재시도 로직을 그대로 유지하고, 기본 URL과 API 키만 변경하여 배포하세요.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});지원되는 엔드포인트
- POST /v1/chat/completions — OpenAI 호환
- POST /v1/messages — Anthropic 호환
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI 호환
- POST /v1/videos/generate — Hypereal 비디오 API
- POST /v1/comfy/{slug} — API로서의 ComfyUI 워크플로우
- POST /v1/gpu/{slug} — 서버리스 GPU 패스스루
모델을 넘어: 일급 API로서의 컴퓨팅.
모든 팀은 결국 채팅 완성 이상의 것을 필요로 합니다. 맞춤형 ComfyUI 그래프, 미세 조정, 일회성 GPU 작업 등 Hypereal은 동일한 키, 동일한 로그, 동일한 예산으로 이러한 기능을 제공합니다.
서버리스 GPU 패스스루
자체 RunPod 핸들러를 가져와 POST /v1/gpu/{slug}로 호출하세요. 저희는 인증, 측정, 재시도 및 청구를 처리합니다. 핸들러는 직접 작성하시면 됩니다.
API로서의 ComfyUI 워크플로우
어떤 ComfyUI 워크플로우 JSON이든 업로드하세요. 실행당 요금이 청구되는, 유형이 지정된 입력 및 출력을 가진 버전 관리된 HTTP 엔드포인트를 제공합니다. 더 이상 Slack에 그래프를 붙여넣을 필요가 없습니다.
ComfyUI 라이브러리
얼굴 복원, 제품 촬영, 시네마틱 업스케일 등 미리 구축된 ComfyUI 워크플로우의 증가하는 카탈로그를 다른 모델처럼 호출하세요.
LoRA 및 자산 저장소
LoRA, 체크포인트, 임베딩 및 참조 이미지를 위한 비공개 버전 관리 저장소입니다. 모든 워크플로우 또는 생성에서 핸들로 참조하세요.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}저희가 공개하는 숫자입니다. 영업 자료의 스크린샷이 아닙니다.
실시간 상태 페이지, 투명한 지연 시간, 그리고 저희에게 먼저 묻지 않고도 읽을 수 있는 사고 기록을 제공합니다.
투명한 지연 시간
모든 게이트웨이 엔드포인트에 대한 지역별 p50 및 p95 롤링.
가동 시간 기록
지난 30/90일간의 가동 시간, 마케팅 수치 조작 없음. 숫자는 숫자 그대로입니다.

