Gemini 3.5 Fast API
코딩 에이전트와 채팅 앱을 위한 저지연 Gemini.
OpenAI 호환 엔드포인트로 gemini-3.5-fast를 실행하세요. Coding Plan 가격은 100만 토큰당 입력 $0.90 / 출력 $5.40으로 Google 공식가보다 일괄 40% 저렴합니다.
Gemini 3.5 Fast pricing
Coding Plan price vs Google official token pricing
몇 분 만에 통합
모든 언어에서 사용 가능한 표준 REST API입니다. 하나의 API 키로 모든 모델에 접근할 수 있습니다.
- 모든 모델을 위한 단일 엔드포인트
- Bearer 토큰 인증
- JSON 요청 및 응답
- 비동기 작업을 위한 Webhook 콜백
- Python 및 Node.js SDK 제공
curl https://api.hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer hyp-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{"role": "user", "content": "Generate unit tests for this parser."}
]
}'왜 Gemini 3.5 Fast인가
Coding Plan eligible
Spend Coding Plan credits on Gemini 3.5 Fast alongside Claude Opus, Sonnet, and GPT-5.5 — one prepaid pool, one API key.
Built for latency and volume
Sub-second first token — best for quick code review, chat, test generation, and iterative agent loops.
40% off official pricing
$0.90 input / $5.40 output per million tokens vs Google official $1.50 / $9.00. A flat 40% off, no tiers.
어떤 크레딧이 소비되나요?
하나의 API 키로 둘 다 사용할 수 있습니다. 라우팅은 키가 아니라 호출하는 모델에 따라 결정됩니다.
Claude Opus 4.7, Sonnet 4.6, GPT-5.5, Gemini 3.5 Thinking, Gemini 3.5 Fast는 Coding Credits를 먼저 차감(FIFO)하고, 부족할 경우 General Credits로 폴백합니다.
이미지, 영상, 오디오, 3D, 그 외 모든 LLM은 General Credits만 차감합니다. Coding Credits는 코딩 워크로드용으로 유지됩니다.
자주 묻는 질문
Is Gemini 3.5 Fast included in the Coding Plan?
Yes. It is eligible for Coding Plan credits, so prepaid coding credits spend on it just like Claude Opus, Sonnet, and GPT-5.5.
What is the model ID?
Use gemini-3.5-fast in chat, /v1/chat/completions, and any OpenAI-compatible SDK call.
When should I use Fast instead of Thinking?
Use Fast for latency-sensitive coding loops, tests, and chat. Use Thinking for deeper review or multi-step reasoning. Both cost the same per token.
Coding Credits로 Gemini 3.5 Fast 사용.
API 키를 만들고 base_url을 Hypereal로 설정한 뒤 OpenAI 호환 도구에서 호출하세요.

