Gemini 3.5 Fast API
Gemini o niskim opóźnieniu dla agentów kodujących i aplikacji czatu.
Uruchamiaj gemini-3.5-fast przez endpoint zgodny z OpenAI. Cena Coding Plan to $0.90 za wejście / $5.40 za wyjście na milion tokenów — równe 40% poniżej oficjalnej ceny Google — rozliczane jednym kluczem API Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Integracja w kilka minut
Standardowe API REST, które działa z każdym językiem. Jeden klucz API daje dostęp do wszystkich modeli.
- Jeden punkt końcowy dla wszystkich modeli
- Uwierzytelnianie tokenem Bearer
- Żądanie i odpowiedź w formacie JSON
- Wywołania zwrotne webhook dla zadań asynchronicznych
- Dostępne SDK dla Python i Node.js
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Dlaczego Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Które kredyty są zużywane?
Jeden klucz API działa dla obu. Routing zależy od wywoływanego modelu, a nie od klucza.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast najpierw zużywają Coding Credits (FIFO), a po ich wyczerpaniu sięgają po General Credits.
Obraz, wideo, audio, 3D i wszystkie inne LLM-y zużywają wyłącznie General Credits. Coding Credits pozostają zarezerwowane dla zadań kodowania.
Często zadawane pytania
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Używaj Gemini 3.5 Fast z Coding Credits.
Utwórz klucz API, ustaw base_url na Hypereal i wywołuj gemini-3.5-fast z narzędzi zgodnych z OpenAI.

