Gemini 3.5 Fast API
Latenzarmes Gemini für Coding-Agenten und Chat-Apps.
Führen Sie gemini-3.5-fast über einen OpenAI-kompatiblen Endpunkt aus. Der Coding-Plan-Preis beträgt $0.90 Input / $5.40 Output pro Million Tokens — pauschal 40% unter dem offiziellen Google-Preis — abgerechnet über einen einzigen Hypereal-API-Schlüssel.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integrate in minutes
Standard REST API that works mit beliebige language. Eine API-Key gives you access zu alle Modelle.
- Single Endpunkt für alle Modelle
- Bearer Token authentication
- JSON Anfrage & Antwort
- Webhook callbacks für async jobs
- Python & Node.js SDK verfügbar
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Why Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Welches Guthaben wird verbraucht?
Ein API-Schlüssel funktioniert für beides. Das Routing richtet sich nach dem aufgerufenen Modell, nicht nach dem Schlüssel.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast ziehen zuerst von den Coding Credits ab (FIFO) und greifen auf die General Credits über, sobald die Coding Credits aufgebraucht sind.
Bild, Video, Audio, 3D und alle anderen LLMs ziehen ausschließlich von den General Credits ab. Coding Credits bleiben für Coding-Workloads reserviert.
Frequently asked questions
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Nutzen Sie Gemini 3.5 Fast mit Coding Credits.
Erstellen Sie einen API-Schlüssel, setzen Sie base_url auf Hypereal und rufen Sie gemini-3.5-fast aus OpenAI-kompatiblen Tools auf.

