Gemini 3.5 Fast API
Gemini latensi rendah untuk agen coding dan aplikasi chat.
Jalankan gemini-3.5-fast melalui endpoint yang kompatibel dengan OpenAI. Harga Coding Plan adalah $0.90 input / $5.40 output per juta token — tetap 40% di bawah harga resmi Google — ditagih melalui satu kunci API Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integrasi dalam hitungan menit
API REST standar yang berfungsi dengan bahasa apa pun. Satu kunci API memberi Anda akses ke semua model.
- Satu endpoint untuk semua model
- Autentikasi token Bearer
- Permintaan & respons JSON
- Callback webhook untuk pekerjaan asinkron
- SDK Python & Node.js tersedia
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Mengapa Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Kredit mana yang terpakai?
Satu kunci API berfungsi untuk keduanya. Perutean ditentukan oleh model yang Anda panggil, bukan oleh kuncinya.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast memotong Coding Credits lebih dulu (FIFO), lalu jatuh ke General Credits kalau Coding Credits habis.
Gambar, video, audio, 3D, dan semua LLM lain hanya memotong General Credits. Coding Credits tetap disimpan untuk workload coding.
Pertanyaan yang sering diajukan
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Gunakan Gemini 3.5 Fast dengan Coding Credits.
Buat kunci API, atur base_url ke Hypereal, dan panggil gemini-3.5-fast dari alat apa pun yang kompatibel dengan OpenAI.

