Gemini 3.5 Fast API
Gemini з низькою затримкою для кодинг-агентів і чат-застосунків.
Запускайте gemini-3.5-fast через OpenAI-сумісний ендпоінт. Ціна за Coding Plan — $0.90 за вхід / $5.40 за вихід на мільйон токенів — на 40% нижче офіційної ціни Google — оплата через один API-ключ Hypereal.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Інтеграція за лічені хвилини
Стандартний REST API, який працює з будь-якою мовою. Один API-ключ надає вам доступ до всіх моделей.
- Єдина кінцева точка для всіх моделей
- Автентифікація за допомогою Bearer token
- JSON запити та відповіді
- Webhook-колбеки для асинхронних завдань
- Доступні SDK для Python та Node.js
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Чому Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Які кредити витрачаються?
Один ключ API працює для обох. Маршрутизація визначається моделлю, яку ви викликаєте, а не ключем.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast спершу витрачають Coding Credits (FIFO), а потім переливаються в General Credits, якщо Coding Credits закінчилися.
Зображення, відео, аудіо, 3D та всі інші LLM витрачають лише General Credits. Coding Credits залишаються зарезервованими для задач кодування.
Часті запитання
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Використовуйте Gemini 3.5 Fast з Coding Credits.
Створіть API-ключ, вкажіть base_url на Hypereal і викликайте gemini-3.5-fast з OpenAI-сумісних інструментів.

