Gemini 3.5 Fast API
Gemini a bassa latenza per agenti di codice e app di chat.
Esegui gemini-3.5-fast tramite un endpoint compatibile con OpenAI. Il prezzo del Coding Plan è di $0.90 in input / $5.40 in output per milione di token — il 40% in meno del prezzo ufficiale di Google — fatturato con un'unica chiave API Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integra in pochi minuti
API REST standard, compatibile con qualsiasi linguaggio. Una chiave API per accedere a tutti i modelli.
- Un unico endpoint per tutti i modelli
- Autenticazione con bearer token
- Richieste e risposte JSON
- Callback webhook per job asincroni
- SDK Python e Node.js disponibili
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Perché Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Quali crediti vengono consumati?
Una sola chiave API funziona per entrambi. Il routing è deciso dal modello che chiami, non dalla chiave.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast attingono prima ai Coding Credits (FIFO), poi passano ai General Credits se i Coding Credits si esauriscono.
Immagine, video, audio, 3D e tutti gli altri LLM attingono solo ai General Credits. I Coding Credits restano riservati ai workload di coding.
Domande frequenti
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Usa Gemini 3.5 Fast con i Coding Credits.
Crea una chiave API, imposta base_url su Hypereal e chiama gemini-3.5-fast da strumenti compatibili con OpenAI.

