Gemini 3.5 Fast API
Gemini de baixa latência para agentes de código e apps de chat.
Execute o gemini-3.5-fast por meio de um endpoint compatível com OpenAI. O preço do Coding Plan é de $0.90 de entrada / $5.40 de saída por milhão de tokens — 40% abaixo do preço oficial do Google — faturado com uma única chave de API da Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integre em minutos
API REST padrão que funciona com qualquer linguagem. Uma chave de API dá acesso a todos os modelos.
- Endpoint único para todos os modelos
- Autenticação por token Bearer
- Solicitação e resposta JSON
- Callbacks de Webhook para trabalhos assíncronos
- SDK Python e Node.js disponível
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Por que Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Quais créditos são consumidos?
Uma única chave API funciona para ambos. O roteamento é decidido pelo modelo que você chama, não pela chave.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast consomem primeiro os Coding Credits (FIFO) e, se acabarem, passam para os General Credits.
Imagem, vídeo, áudio, 3D e todos os outros LLMs consomem apenas os General Credits. Os Coding Credits ficam reservados para cargas de trabalho de programação.
Perguntas frequentes
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Use o Gemini 3.5 Fast com Coding Credits.
Crie uma chave de API, defina base_url para a Hypereal e chame o gemini-3.5-fast a partir de ferramentas compatíveis com OpenAI.

