請求書が届く前に、いくら使っているか把握できます。
すべてのゲートウェイリクエストは、リアルタイムで価格設定、属性付け、ログ記録されます。モデルごとのダッシュボード、月次予測、予算ガードレールがすぐに利用でき、Datadogダッシュボードは不要です。
コストダッシュボード
日々の支出傾向、モデルごとの内訳、費用のかかるリクエストトップ10。CFOが実際に求めていたビューです。
支出予測
月末までの燃焼率を予測し、カードに請求される数週間前に超過を把握できます。
予算アラート
キーごとの月間上限。80%と100%でメール通知(スパム防止のためのクールダウン付き)。オプションの自動一時停止機能により、暴走ループを停止させます。
署名付きWebhook
支出閾値、キー作成、キー失効、生成失敗などのHMAC署名付きイベント。PagerDuty、Slack、または独自の台帳に連携できます。
障害は発生します。しかし、ユーザーはそれに気づくべきではありません。
マルチプロバイダーフェイルオーバー、地域フォールバック、意図認識ルーティングにより、脆弱な単一ベンダー依存を冗長で自己修復するレイヤーに変えます。
マルチプロバイダーフェイルオーバー
キーごとのタイムアウトと再試行ポリシーを設定可能。5xxエラーまたはタイムアウトが発生した場合、トラフィックはチェーン内の次のプロバイダーに透過的に切り替わります。
POST /v1/chat/completions ├── primary → openai/gpt-4.1-mini [503 in 8s] ✗ ├── fallback 1 → google/gemini-2.5-flash [200 in 612ms] ✓ └── fallback 2 → anthropic/claude-haiku (skipped) served 200 OK · upstream: gemini · total 624ms
スマートルーティング
高速チャット、詳細な推論、画像編集、長文要約など、意図を伝えるだけで、最も安価で適切なプロバイダーを選択します。必要に応じて、特定のモデルを固定することも可能です。
地域フォールバック
プロバイダーのUS-Eastリージョンが劣化した場合、リクエストを失敗させる前にUS-West、次にEUを試行します。リージョンの固定はキーごとに設定可能です。
セキュリティレビューを満たすキーごとの制御。
スコープ付きキー、きめ細かなレート制限、IP許可リスト、不変の監査ログ、CSVエクスポート。CTOと監査人の両方が尋ねる質問に対応できるように設計されています。
APIキーのスコープ設定
モデルごとの許可/拒否、IP許可リスト、日次および時間ごとの支出上限。再デプロイせずにローテーションできます。
キーごと、モデルごとのレート制限
RPMおよびTPM制限は、キーとモデルにスコープされます。ステージングキーが誤って本番環境のクォータを使い果たすことはありません。
不変の監査ログ
作成されたすべてのキー、変更されたスコープ、移動された予算、または取り消しは、アクター、IP、およびタイムスタンプとともに記録されます。デフォルトでSOC2ベースラインに準拠しています。
検索可能なログ + CSVエクスポート
エンドポイント、モデル、ステータス、レイテンシ、キーでリクエストログをフィルタリングできます。財務、コンプライアンス、または事後分析のためにワンクリックでCSVをエクスポートできます。
コンプライアンス体制
- TLS 1.2+エンドツーエンド。キーは保存時にハッシュ化され、プレーンテキストでログに記録されることはありません。
- テナントごとのキーと予算の分離。テナント間のデータ漏洩はありません。
- 設定可能なログ保持期間。機密性の高いワークロードでは、必要に応じてリクエストボディを破棄できます。
- データレジデンシーに敏感なデプロイメント向けに、EUおよび米国のルーティングをリクエストに応じて利用可能です。
- 2026年にはSOC2コントロールが対象となります。現在の監査人からの書簡が必要な場合はお問い合わせください。
OpenAI SDKのドロップイン。ベースURLを1つ入れ替えるだけです。
HyperealはOpenAI Chat Completions、Images、Responses、およびAnthropic Messagesに対応しています。SDK、プロンプト、ツール定義、リトライをそのまま使用し、ベースURLとAPIキーを変更するだけでデプロイできます。
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4.1-mini",
"messages": [{ "role": "user", "content": "hi" }]
}'import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.HYPEREAL_API_KEY,
baseURL: "https://api.hypereal.cloud/v1",
});
const res = await client.chat.completions.create({
model: "gpt-4.1-mini",
messages: [{ role: "user", content: "hi" }],
});サポートされているエンドポイント
- POST /v1/chat/completions — OpenAI互換
- POST /v1/messages — Anthropic互換
- POST /v1/responses — OpenAI Responses API
- POST /v1/images/generations — OpenAI互換
- POST /v1/videos/generate — Hypereal動画API
- POST /v1/comfy/{slug} — ComfyUIワークフローをAPIとして
- POST /v1/gpu/{slug} — サーバーレスGPUパススルー
モデルを超えて:ファーストクラスAPIとしてのコンピューティング。
どのチームも最終的にはチャット補完以上のもの、つまりカスタムのComfyUIグラフ、ファインチューン、単発のGPUジョブなどを必要とします。Hyperealはこれらを同じキー、同じログ、同じ予算で公開します。
サーバーレスGPUパススルー
独自のRunPodハンドラーを持ち込み、POST /v1/gpu/{slug}として呼び出します。認証、計測、再試行、請求は当社が処理します。ハンドラーはご自身で作成してください。
APIとしてのComfyUIワークフロー
任意のComfyUIワークフローJSONをアップロードしてください。タイプ付きの入力と出力を持つバージョン管理されたHTTPエンドポイントを提供し、実行ごとに課金されます。Slackにグラフを貼り付ける必要はもうありません。
ComfyUIライブラリ
顔の復元、商品撮影、シネマティックアップスケールなど、事前に構築されたComfyUIワークフローのカタログは増え続けており、他のモデルと同様に呼び出すことができます。
LoRA & アセットリポジトリ
LoRA、チェックポイント、埋め込み、参照画像のためのプライベートなバージョン管理されたストレージです。任意のワークフローや生成からハンドルで参照できます。
POST /v1/comfy/cinematic-upscale
{
"inputs": { "image_url": "https://...", "strength": 0.8 },
"version": "v3"
}
POST /v1/gpu/my-handler
{
"input": { "prompt": "a cat", "steps": 28 }
}当社が公開する数値。セールス資料のスクリーンショットではありません。
ライブステータスページ、透明性のあるレイテンシー、そして事前にお問い合わせいただくことなく閲覧できるインシデント履歴。
透明性のあるレイテンシー
地域ごとのすべてのゲートウェイエンドポイントに対するローリングp50およびp95。
稼働履歴
過去30日/90日間の稼働時間。マーケティング的な計算は含みません。数値は数値です。

