Gemini 3.5 Fast API
कोडिंग एजेंट्स और चैट ऐप्स के लिए कम-लेटेंसी वाला Gemini।
gemini-3.5-fast को एक drop-in OpenAI-संगत endpoint के माध्यम से चलाएं। Coding Plan की कीमत प्रति मिलियन टोकन $0.90 इनपुट / $5.40 आउटपुट है — Google की आधिकारिक कीमत से सीधे 40% कम — एक Hypereal API key के माध्यम से बिल की जाती है।
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
मिनटों में integrate करें
किसी भी language के साथ काम करने वाला standard REST API। एक API key से सभी models पर पहुँच।
- सभी models के लिए एक endpoint
- Bearer token authentication
- JSON request और response
- Async jobs के लिए webhook callbacks
- Python और Node.js SDK उपलब्ध
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Gemini 3.5 Fast क्यों
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
कौन से क्रेडिट खर्च होते हैं?
एक ही API की दोनों के लिए काम करती है। रूटिंग आपके द्वारा कॉल किए गए मॉडल से तय होती है, की से नहीं।
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast पहले Coding Credits खर्च करते हैं (FIFO), फिर Coding Credits खत्म होने पर General Credits में spill करते हैं।
Image, video, audio, 3D और सभी अन्य LLMs केवल General Credits खर्च करते हैं। Coding Credits coding workloads के लिए reserved रहते हैं।
Frequently asked questions
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Coding Credits के साथ Gemini 3.5 Fast का उपयोग करें।
एक API key बनाएं, base_url को Hypereal पर सेट करें और OpenAI-संगत टूल्स से gemini-3.5-fast को कॉल करें।

