Gemini 3.5 Fast API
جمینای کمتأخیر برای عاملهای کدنویسی و اپلیکیشنهای چت.
gemini-3.5-fast را از طریق یک endpoint سازگار با OpenAI اجرا کنید. قیمت Coding Plan برابر است با $0.90 ورودی / $5.40 خروجی به ازای هر میلیون توکن — دقیقاً ۴۰٪ کمتر از قیمت رسمی Google — با صورتحساب از طریق یک کلید API واحد Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
ادغام در چند دقیقه
API REST استاندارد که با هر زبانی کار میکند. یک کلید API به شما امکان دسترسی به تمام مدلها را میدهد.
- یک نقطه پایانی برای همه مدلها
- احراز هویت با توکن Bearer
- درخواست و پاسخ JSON
- کالبکهای وبهوک برای کارهای ناهمگام
- SDK پایتون و Node.js موجود است
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'چرا Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
کدام اعتبار مصرف میشود؟
یک کلید API برای هر دو کار میکند. مسیریابی بر اساس مدلی که فراخوانی میکنید تعیین میشود، نه کلید.
Claude Opus 4.7، Sonnet 4.6 و GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast ابتدا Coding Credits را (FIFO) مصرف میکنند، سپس در صورت اتمام Coding Credits به General Credits سرریز میشوند.
تصویر، ویدئو، صدا، 3D و همه LLMهای دیگر فقط General Credits را مصرف میکنند. Coding Credits برای کارهای کدنویسی رزرو میماند.
سوالات متداول
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
از Gemini 3.5 Fast با Coding Credits استفاده کنید.
یک کلید API بسازید، base_url را روی Hypereal تنظیم کنید و gemini-3.5-fast را از ابزارهای سازگار با OpenAI فراخوانی کنید.

