Cómo usar Gemini 3.5 Thinking y Fast API gratis
Empieza con créditos gratuitos de Hypereal y luego ejecuta Gemini 3.5 Thinking o Fast a través de un endpoint compatible con OpenAI

Gemini 3.5 ya está disponible en Hypereal en dos variantes optimizadas para programación:
- gemini-3.5-thinking para razonamiento profundo, revisión de código y tareas de programación en múltiples pasos
- gemini-3.5-fast para chat de baja latencia, generación de pruebas y bucles de agentes
Ambos modelos están incluidos en el Coding Plan. El precio del Coding Plan es de $0.90 por 1M tokens de entrada y $5.40 por 1M tokens de salida — un 40% por debajo del precio oficial de Google de $1.50 / $9.00.
Las cuentas nuevas reciben créditos gratuitos, por lo que puedes probar la API antes de comprar un paquete de Coding Credits.
Paso 1: Crea una cuenta gratuita en Hypereal
Regístrate en hypereal.cloud, abre el panel de control y crea una clave API en Manage API Keys.
Guárdala como variable de entorno:
export HYPEREAL_API_KEY="ck_..."
Paso 2: Llama a Gemini 3.5 Thinking
Usa Thinking cuando necesites un razonamiento cuidadoso sobre código, diffs, registros o descripciones de tareas largas.
curl https://hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-thinking",
"messages": [
{
"role": "user",
"content": "Review this API handler and identify the highest-risk bug."
}
]
}'
Paso 3: Llama a Gemini 3.5 Fast
Usa Fast cuando la latencia importe más que la profundidad máxima.
curl https://hypereal.cloud/v1/chat/completions \
-H "Authorization: Bearer $HYPEREAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-fast",
"messages": [
{
"role": "user",
"content": "Write Jest tests for a date parser with edge cases."
}
]
}'
Paso 4: Usa el SDK de OpenAI
Hypereal es compatible con OpenAI para chat completions:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["HYPEREAL_API_KEY"],
base_url="https://hypereal.cloud/v1",
)
resp = client.chat.completions.create(
model="gemini-3.5-thinking",
messages=[
{"role": "user", "content": "Plan a safe migration for this schema change."}
],
)
print(resp.choices[0].message.content)
Precios y créditos
| Model | Hypereal input | Hypereal output | Google official benchmark | Notes |
|---|---|---|---|---|
| gemini-3.5-thinking | $0.90 / 1M | $5.40 / 1M | $1.50 / $9.00 | Ideal para razonamiento |
| gemini-3.5-fast | $0.90 / 1M | $5.40 / 1M | $1.50 / $9.00 | Ideal para velocidad |
Los créditos de prueba gratuitos son suficientes para las pruebas iniciales de la API. Para cargas de trabajo de programación en producción, compra Coding Credits desde el panel de control. Los Coding Credits están reservados para Claude Opus, Claude Sonnet, GPT-5.5, Gemini 3.5 Thinking y Gemini 3.5 Fast.
¿Cuál deberías elegir?
Elige Gemini 3.5 Thinking para revisión de arquitectura, planes de depuración, razonamiento sobre bases de código y tareas donde una respuesta más lenta es aceptable.
Elige Gemini 3.5 Fast para bucles estilo autocompletado, generación rápida de pruebas, chat y agentes que necesitan muchas llamadas pequeñas.
Ambos usan la misma clave API, el mismo endpoint y el mismo sistema de facturación.
Publicaciones relacionadas
Download Hypereal Agent
Run a local AI media workspace for image generation, video prompts, model selection, credit tracking, and saved artifacts.




