Gemini 3.5 Fast API
Gemini à faible latence pour les agents de code et les apps de chat.
Exécutez gemini-3.5-fast via un endpoint compatible OpenAI. Le tarif du Coding Plan est de $0.90 en entrée / $5.40 en sortie par million de tokens — soit 40% sous le tarif officiel de Google — facturé avec une seule clé d'API Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integrate in minutes
Standard REST API that works with any language. One clé API gives you access to all modèles.
- Single endpoint for all modèles
- Bearer jeton authentication
- JSON request & response
- Webhook callbacks for async jobs
- Python & Node.js SDK available
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Why Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Quels crédits sont consommés ?
Une seule clé API fonctionne pour les deux. Le routage dépend du modèle appelé, pas de la clé.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast puisent d'abord dans les Coding Credits (FIFO), puis basculent sur les General Credits si les Coding Credits sont épuisés.
Image, vidéo, audio, 3D et tous les autres LLM puisent uniquement dans les General Credits. Les Coding Credits restent réservés aux workloads de code.
Questions fréquemment posées
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Utilisez Gemini 3.5 Fast avec les Coding Credits.
Créez une clé d'API, définissez base_url sur Hypereal et appelez gemini-3.5-fast depuis des outils compatibles OpenAI.

