Gemini 3.5 Fast API
Gemini độ trễ thấp cho agent lập trình và ứng dụng chat.
Chạy gemini-3.5-fast qua một endpoint tương thích OpenAI. Giá Coding Plan là $0.90 đầu vào / $5.40 đầu ra cho mỗi triệu token — thấp hơn 40% so với giá chính thức của Google — thanh toán qua một khóa API Hypereal duy nhất.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
Tích hợp trong vài phút
REST API chuẩn hoạt động với mọi ngôn ngữ. Một API key cho phép bạn truy cập mọi mô hình.
- Một endpoint cho mọi mô hình
- Xác thực Bearer token
- Request & response JSON
- Webhook callback cho job bất đồng bộ
- SDK Python & Node.js sẵn có
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'Vì sao Gemini 3.5 Fast
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
Tín dụng nào bị tiêu hao?
Một khóa API dùng được cho cả hai. Định tuyến do mô hình bạn gọi quyết định, không phải do khóa.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast trừ Coding Credits trước (FIFO), nếu hết thì rớt xuống General Credits.
Hình ảnh, video, audio, 3D và toàn bộ LLM khác chỉ trừ General Credits. Coding Credits được giữ riêng cho workload lập trình.
Câu hỏi thường gặp
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Sử dụng Gemini 3.5 Fast với Coding Credits.
Tạo một khóa API, đặt base_url trỏ đến Hypereal và gọi gemini-3.5-fast từ các công cụ tương thích OpenAI.

