Gemini 3.5 Fast API
Gemini met lage latentie voor codeeragents en chat-apps.
Voer gemini-3.5-fast uit via een OpenAI-compatibel endpoint. De Coding Plan-prijs is $0.90 invoer / $5.40 uitvoer per miljoen tokens — een vaste 40% onder de officiële Google-prijs — gefactureerd via één Hypereal API-sleutel.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integreer in minuten
Standaard REST API die met elke taal werkt. Eén API key geeft toegang tot alle modellen.
- Eén endpoint voor alle modellen
- Bearer token-authenticatie
- JSON request & response
- Webhook callbacks voor async jobs
- Python- & Node.js-SDK beschikbaar
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Waarom Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Welke credits worden verbruikt?
Eén API-sleutel werkt voor beide. Routing wordt bepaald door het model dat je aanroept, niet door de sleutel.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast putten eerst uit de Coding Credits (FIFO) en vallen daarna terug op General Credits als de Coding Credits op zijn.
Beeld, video, audio, 3D en alle andere LLM's putten alleen uit General Credits. Coding Credits blijven gereserveerd voor coding-workloads.
Veelgestelde vragen
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Gebruik Gemini 3.5 Fast met Coding Credits.
Maak een API-sleutel aan, stel base_url in op Hypereal en roep gemini-3.5-fast aan vanuit OpenAI-compatibele tools.

