Cổng AI doanh nghiệp + Nền tảng điện toán
Một khóa API. Mọi mô hình, mọi GPU, mọi quy trình ComfyUI. Với chi phí, kiểm toán và độ tin cậy mà CFO và CTO của bạn đã yêu cầu.
Được sử dụng trong sản xuất bởi các nhóm cung cấp tính năng hình ảnh, video, giọng nói và trò chuyện cho hàng triệu người dùng cuối.
Biết rõ chi phí của bạn trước khi hóa đơn đến.
Mọi yêu cầu cổng đều được định giá, phân bổ và ghi lại theo thời gian thực. Bảng điều khiển theo mô hình, dự báo hàng tháng và giới hạn ngân sách — sẵn có, không cần bảng điều khiển Datadog.
Bảng điều khiển chi phí
Xu hướng chi tiêu hàng ngày, phân tích theo mô hình, 10 yêu cầu đắt nhất. Chế độ xem mà CFO của bạn thực sự yêu cầu.
Dự báo chi tiêu
Tỷ lệ đốt cháy được dự kiến đến cuối tháng để bạn có thể thấy các khoản vượt mức hàng tuần trước khi chúng ảnh hưởng đến thẻ của bạn.
Cảnh báo ngân sách
Giới hạn hàng tháng cho mỗi khóa. Email ở mức 80% và 100% với thời gian chờ để bạn không bị spam. Tùy chọn tự động tạm dừng sẽ chấm dứt các vòng lặp vượt ngoài tầm kiểm soát.
Webhook đã ký
Các sự kiện được ký HMAC cho ngưỡng chi tiêu, khóa được tạo, khóa bị thu hồi, tạo thất bại. Kết nối chúng với PagerDuty, Slack hoặc sổ cái của riêng bạn.
Sự cố xảy ra. Người dùng của bạn không nên nhận thấy.
Chuyển đổi dự phòng đa nhà cung cấp, dự phòng khu vực và định tuyến nhận biết ý định biến một phụ thuộc nhà cung cấp duy nhất dễ bị tổn thương thành một lớp dự phòng, tự phục hồi.
Chuyển đổi dự phòng đa nhà cung cấp
Thời gian chờ và chính sách thử lại có thể cấu hình cho mỗi khóa. Khi gặp lỗi 5xx hoặc hết thời gian chờ, lưu lượng truy cập sẽ tự động chuyển sang nhà cung cấp tiếp theo trong chuỗi.
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
Định tuyến thông minh
Hãy cho chúng tôi biết mục đích — trò chuyện nhanh, suy luận sâu, chỉnh sửa ảnh, tóm tắt văn bản dài — và chúng tôi sẽ chọn nhà cung cấp đủ điều kiện rẻ nhất. Ghim một mô hình chính xác khi bạn cần.
Dự phòng theo khu vực
Nếu khu vực US-East của nhà cung cấp bị suy giảm, chúng tôi sẽ thử US-West, sau đó là EU, trước khi yêu cầu thất bại. Khả năng gắn kết khu vực có thể cấu hình cho mỗi khóa.
Kiểm soát theo từng khóa đáp ứng đánh giá bảo mật.
Khóa có phạm vi, giới hạn tốc độ chi tiết, danh sách cho phép IP, nhật ký kiểm toán bất biến và xuất CSV. Được thiết kế để trả lời các câu hỏi mà cả CTO và kiểm toán viên của bạn sẽ đặt ra.
Phạm vi khóa API
Cho phép/từ chối mô hình theo từng khóa, danh sách cho phép IP, giới hạn chi tiêu hàng ngày và hàng giờ. Xoay vòng mà không cần triển khai lại.
Giới hạn tốc độ theo từng khóa, từng mô hình
Giới hạn RPM và TPM được giới hạn theo khóa và mô hình. Khóa thử nghiệm không thể vô tình làm cạn kiệt hạn ngạch của môi trường sản xuất.
Nhật ký kiểm toán bất biến
Mọi khóa được tạo, phạm vi thay đổi, ngân sách di chuyển hoặc thu hồi đều được ghi lại với tác nhân, IP và dấu thời gian. Mặc định theo tiêu chuẩn SOC2.
Nhật ký có thể tìm kiếm + Xuất CSV
Lọc nhật ký yêu cầu theo điểm cuối, mô hình, trạng thái, độ trễ, khóa. CSV một cú nhấp chuột cho tài chính, tuân thủ hoặc phân tích sau sự cố.
Tư thế tuân thủ
- TLS 1.2+ từ đầu đến cuối. Khóa được băm khi lưu trữ, không bao giờ được ghi nhật ký dưới dạng văn bản rõ.
- Cách ly khóa + ngân sách theo từng người thuê. Không rò rỉ dữ liệu giữa các người thuê.
- Lưu giữ nhật ký có thể cấu hình. Bỏ qua các phần thân yêu cầu theo yêu cầu đối với các tác vụ có độ nhạy cao.
- Định tuyến EU và US có sẵn theo yêu cầu cho các triển khai nhạy cảm về nơi cư trú dữ liệu.
- Kiểm soát SOC2 trong phạm vi cho năm 2026. Hãy liên hệ nếu bạn cần thư hiện tại từ kiểm toán viên của chúng tôi.
Thay thế trực tiếp cho OpenAI SDK. Chỉ cần thay đổi một URL cơ sở.
Hypereal hỗ trợ OpenAI Chat Completions, Images, Responses và Anthropic Messages. Giữ nguyên SDK, lời nhắc, định nghĩa công cụ, các lần thử lại của bạn — chỉ cần thay đổi URL cơ sở và khóa API, sau đó triển khai.
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});Điểm cuối được hỗ trợ
- POST /v1/chat/completions — Tương thích OpenAI
- POST /v1/messages — Tương thích Anthropic
- POST /v1/responses — API Phản hồi OpenAI
- POST /v1/images/generations — Tương thích OpenAI
- POST /v1/videos/generate — API video Hypereal
- POST /v1/comfy/{slug} — Quy trình làm việc ComfyUI dưới dạng API
- POST /v1/gpu/{slug} — Truyền qua GPU không máy chủ
Vượt xa các mô hình: tính toán như một API hạng nhất.
Mọi nhóm cuối cùng đều cần nhiều hơn các hoàn thành trò chuyện — một biểu đồ ComfyUI tùy chỉnh, một tinh chỉnh, một công việc GPU một lần. Hypereal hiển thị những điều đó đằng sau cùng một khóa, cùng nhật ký, cùng ngân sách.
Truyền qua GPU không máy chủ
Mang theo trình xử lý RunPod của riêng bạn và gọi nó dưới dạng POST /v1/gpu/{slug}. Chúng tôi xử lý xác thực, đo lường, thử lại và hóa đơn. Bạn viết trình xử lý.
Quy trình làm việc ComfyUI dưới dạng API
Tải lên bất kỳ JSON quy trình làm việc ComfyUI nào. Chúng tôi cung cấp cho bạn một điểm cuối HTTP có phiên bản với đầu vào và đầu ra được định kiểu, được tính phí theo mỗi lần chạy. Không còn phải dán biểu đồ vào Slack nữa.
Thư viện ComfyUI
Một danh mục ngày càng tăng các quy trình làm việc ComfyUI được xây dựng sẵn — phục hồi khuôn mặt, ảnh sản phẩm, nâng cấp điện ảnh — gọi chúng như bất kỳ mô hình nào khác.
Kho lưu trữ LoRA & Tài sản
Lưu trữ riêng tư, có phiên bản cho LoRA, điểm kiểm tra, nhúng và hình ảnh tham chiếu. Tham chiếu chúng bằng tay cầm từ bất kỳ quy trình làm việc hoặc tạo nào.
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}Các con số chúng tôi công bố. Không phải ảnh chụp màn hình trong một bản thuyết trình bán hàng.
Trang trạng thái trực tiếp, độ trễ minh bạch và lịch sử sự cố bạn có thể đọc mà không cần hỏi chúng tôi trước.
Trang trạng thái công khai
Trạng thái trực tiếp theo từng điểm cuối và dòng thời gian sự cố.
Xem trang trạng tháiĐộ trễ minh bạch
p50 và p95 luân phiên cho mọi điểm cuối cổng, theo khu vực.
Lịch sử thời gian hoạt động
Thời gian hoạt động trong 30/90 ngày gần nhất, không tính toán theo kiểu marketing. Con số là con số thực tế.
Ngừng chạy 8 bảng điều khiển của nhà cung cấp.
Một khóa API, một hóa đơn, một nơi để xem mọi thứ đang diễn ra. Bắt đầu và chạy trong vòng chưa đầy năm phút.

