Como usar a API do Gemini 3.5 Thinking e Fast de graça
Comece com créditos gratuitos da Hypereal e execute o Gemini 3.5 Thinking ou Fast por um endpoint compatível com OpenAI

O Gemini 3.5 já está disponível na Hypereal em duas variantes voltadas para programação:
- gemini-3.5-thinking para raciocínio aprofundado, revisão de código e trabalhos de programação em múltiplas etapas
- gemini-3.5-fast para chat de baixa latência, geração de testes e loops de agentes
Ambos os modelos estão incluídos no Coding Plan. O preço do Coding Plan é de $0.90 por 1M tokens de entrada e $5.40 por 1M tokens de saída — 40% abaixo do preço oficial do Google de $1.50 / $9.00.
Novas contas recebem créditos gratuitos, então você pode testar a API antes de comprar um pacote de Coding Credits.
Passo 1: Crie uma conta gratuita na Hypereal
Cadastre-se em hypereal.cloud, abra o painel e crie uma chave de API em Manage API Keys.
Salve-a como variável de ambiente:
export HYPEREAL_API_KEY="ck_..."
Passo 2: Chame o Gemini 3.5 Thinking
Use o Thinking quando quiser um raciocínio cuidadoso sobre código, diffs, logs ou descrições longas de tarefas.
curl https://hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-thinking",
"messages": [
{
"role": "user",
"content": "Review this API handler and identify the highest-risk bug."
}
]
}'
Passo 3: Chame o Gemini 3.5 Fast
Use o Fast quando a latência importa mais do que a profundidade máxima.
curl https://hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{
"role": "user",
"content": "Write Jest tests for a date parser with edge cases."
}
]
}'
Passo 4: Use o SDK da OpenAI
A Hypereal é compatível com OpenAI para chat completions:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["HYPEREAL_API_KEY"],
base_url="https://hypereal.cloud/v1",
)
resp = client.chat.completions.create(
model="gemini-3.5-thinking",
messages=[
{"role": "user", "content": "Plan a safe migration for this schema change."}
],
)
print(resp.choices[0].message.content)
Preços e créditos
| Model | Hypereal input | Hypereal output | Google official benchmark | Notes |
|---|---|---|---|---|
| gemini-3.5-thinking | $0.90 / 1M | $5.40 / 1M | $1.50 / $9.00 | Ideal para raciocínio |
| gemini-3.5-fast | $0.90 / 1M | $5.40 / 1M | $1.50 / $9.00 | Ideal para velocidade |
Os créditos de teste gratuitos são suficientes para os primeiros testes da API. Para cargas de trabalho de programação em produção, compre Coding Credits pelo painel. Os Coding Credits são reservados para Claude Opus, Claude Sonnet, GPT-5.5, Gemini 3.5 Thinking e Gemini 3.5 Fast.
Qual devo escolher?
Escolha Gemini 3.5 Thinking para revisão de arquitetura, planejamento de depuração, raciocínio sobre bases de código e tarefas em que uma resposta mais lenta é aceitável.
Escolha Gemini 3.5 Fast para loops estilo autocomplete, geração rápida de testes, chat e agentes que precisam de muitas chamadas pequenas.
Ambos usam a mesma chave de API, o mesmo endpoint e o mesmo sistema de cobrança.
Publicações Relacionadas
Download Hypereal Agent
Run a local AI media workspace for image generation, video prompts, model selection, credit tracking, and saved artifacts.




