Gemini 3.5 Fast API
Gemini de baja latencia para agentes de código y apps de chat.
Ejecuta gemini-3.5-fast mediante un endpoint compatible con OpenAI. El precio del Coding Plan es de $0.90 de entrada / $5.40 de salida por millón de tokens — un 40% por debajo del precio oficial de Google — facturado con una sola clave de API de Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integra en minutos
API REST estándar que funciona con cualquier lenguaje. Una clave API te da acceso a todos los modelos.
- Un único endpoint para todos los modelos
- Autenticación con token Bearer
- Solicitud y respuesta JSON
- Callbacks de Webhook para trabajos asíncronos
- SDK de Python y Node.js disponible
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'¿Por qué Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
¿Qué créditos se consumen?
Una sola clave API sirve para ambos. El enrutamiento lo decide el modelo que llamas, no la clave.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast consumen primero los Coding Credits (FIFO) y, si se acaban, recurren a los General Credits.
Imagen, vídeo, audio, 3D y los demás LLM consumen solo los General Credits. Los Coding Credits quedan reservados para cargas de trabajo de programación.
Preguntas frecuentes
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Usa Gemini 3.5 Fast con Coding Credits.
Crea una clave de API, configura base_url hacia Hypereal y llama a gemini-3.5-fast desde herramientas compatibles con OpenAI.

