10 бесплатных LLM-моделей на OpenRouter, доступных прямо сейчас (2026)

10 бесплатных LLM-моделей на OpenRouter, доступных прямо сейчас

OpenRouter объединяет более 200 языковых моделей за единым OpenAI-совместимым API. Большинство из них платные, однако стабильный набор открытых frontier-моделей доступен по $0/токен — провайдеры (DeepSeek, Meta, Alibaba, Z.ai, NousResearch) субсидируют их в рамках промоакций или для исследовательских целей.

В этом списке — 10 бесплатных моделей на OpenRouter по состоянию на май 2026 года, которые реально стоит использовать. Не те 100+, что существуют, но работают медленно, глючат или выдают нулевые квоты, а именно рабочие варианты. Для каждой: сильные стороны, слабые места и идентификатор модели.

Бесплатный тариф OpenRouter ограничен примерно 20 запросами в минуту и 200 запросами в сутки на аккаунт. При серьёзных нагрузках этот лимит сгорает за час. В конце статьи показано, как перейти на платный OpenAI-совместимый агрегатор, не переписывая код.

1. `meta-llama/llama-4-maverick:free`

Самый большой открытый вариант Llama 4 от Meta — 405 млрд параметров, маршрутизация через MoE. Лучшая бесплатная модель общего назначения. Хорошо справляется с кодом, многоязычным рассуждением и следованием инструкциям.

Лучше всего: замена GPT-4-класса для задач, где важна экономия.
Слабые места: очень длинные контексты (>128K токенов), сложное использование инструментов.

2. `deepseek/deepseek-r2:free`

Рассуждающая модель DeepSeek (вышла в марте 2026). Обходит GPT-5-mini по математике, конкурирует с Claude Sonnet 4.6 по коду. Цепочки рассуждений видны в ответе.

Лучше всего: математика, код, многошаговые задачи там, где важно видеть ход мыслей.
Слабые места: короткие разговорные ответы (чрезмерно думает). Высокая задержка — TTFT исчисляется секундами.

3. `deepseek/deepseek-v3.2:free`

Универсальная модель DeepSeek без режима рассуждений. Быстрее R2, контекст меньше. Отличный вариант для чата и структурированного вывода.

Лучше всего: высокообъёмный чат, JSON-вывод, вызов функций.
Слабые места: сложные логические цепочки — переключайтесь на R2.

4. `qwen/qwen-3-235b:free`

Qwen 3 от Alibaba, 235 млрд MoE. Сильный многоязычный (особенно китайский, корейский, японский). Неожиданно хорош в коде.

Лучше всего: всё, что не на английском; данные для многоязычного дообучения; китайские технические кейсы.
Слабые места: иногда китайские символы просачиваются в английский вывод. Просто перегенерируйте.

5. `qwen/qwen-3-coder:free`

Специализированный форк Qwen 3 для кода. Выше своего веса на дополнении и рефакторинге кода. Хорошо работает с инструментами.

Лучше всего: агентные циклы разработки на бюджете.
Слабые места: проза, творческое письмо.

6. `z-ai/glm-4.7:free`

GLM-4.7 от Zhipu. Самая дешёвая жизнеспособная модель уровня Claude Sonnet в 2026 году. Неожиданно точное следование промптам.

Лучше всего: структурированный вывод, агентные воркфлоу, где нужно поведение в стиле Claude, но дёшево.
Слабые места: длинные творческие задачи на английском языке.

7. `google/gemma-3-27b:free`

Открытая Gemma 3 от Google, 27 млрд параметров. Выступает значительно выше своего размера — конвейер дистилляции Google действительно на высоте.

Лучше всего: альтернатива для edge-деплоя, быстрый инференс, RAG QA.
Слабые места: сложные рассуждения, код длиннее ~200 строк.

8. `nousresearch/hermes-4-405b:free`

Llama 4 с инструкционным файнтюном от NousResearch. Основной выбор для написания персонажей, ролевых игр и творческих задач, где базовая Llama 4 суховата.

Лучше всего: художественный текст, голос персонажей, ролевые игры, нарративная генерация.
Слабые места: код, математика, структурированный вывод.

9. `microsoft/phi-4-mini:free`

Phi-4-mini, 14 млрд параметров. Серия малых моделей Microsoft. Лучшая бесплатная модель в своём размерном классе по рассуждениям.

Лучше всего: высокопропускные, низколатентные рассуждения. Отлично для дешёвых embedding-of-thought воркфлоу.
Слабые места: длинноконтекстное запоминание, всё, что требует знаний о мире.

10. `mistralai/mistral-large-3:free`

Mistral Large 3 (бесплатный промо-тариф на OpenRouter). Сильная поддержка европейских языков, точное дополнение кода.

Лучше всего: европейские языки, вызов функций, написание кода.
Слабые места: у бесплатного тира самые жёсткие ограничения — быстро начнётся троттлинг.

Как их вызывать

OpenRouter использует OpenAI-совместимый эндпоинт. Стандартный SDK, перед ID модели добавьте префикс:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-...",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-r2:free",
    messages=[{"role": "user", "content": "Explain MoE routing in one paragraph."}],
)

Когда бесплатного тира не хватает

Бесплатный тариф OpenRouter ограничен ~20 RPM и ~200 запросами в сутки. Реальная продакшн-нагрузка выходит за эти рамки за час. Тогда есть два варианта:

Платить за OpenRouter — те же модели, без ограничений по rate, по розничным ценам.
Перейти на другой OpenAI-совместимый агрегатор — та же форма API, зачастую существенно дешевле.

Hypereal относится ко второму варианту. Идентификаторы моделей отличаются, но форма API идентична, и мы хостим большинство тех же открытых моделей вместе с премиальными (GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, NanoBanana 2, Seedance 2.0, GPT Image 2). Hypereal принимает карты СНГ (РФ, КЗ, Беларусь, Украина) без VPN:

client = OpenAI(
    base_url="https://api.hypereal.cloud/v1",
    api_key="ck_...",
)

Для большинства продакшн-нагрузок переход с бесплатного OpenRouter на Hypereal обходится дешевле, чем платный OpenRouter при том же трафике, и без суточного лимита.

Часто задаваемые вопросы

Бесплатные модели OpenRouter действительно бесплатны? Да — провайдеры покрывают затраты. Цена за это: ограничения по rate, периодические очереди, а ваши промпты могут сохраняться для улучшения модели (проверьте политику конфиденциальности каждой модели на OpenRouter).

Почему рассуждающие модели вроде DeepSeek R2 бесплатны? Промоакция. Провайдеры хотят сигнал о принятии продукта и обучающие данные. Политика со временем может измениться.

Можно ли использовать их коммерчески? У каждой модели своя лицензия — Llama 4 (сообщество Llama), Qwen (Apache-стиль), GLM (коммерческое использование ОК), Gemma (Gemma TOU). Проверяйте карточку модели.

С чего начать? Llama 4 Maverick — для общих задач, DeepSeek R2 — для сложных рассуждений, Hermes 4 — для творческого письма, Qwen 3 — для многоязычного.

Начните прямо сейчас

Бесплатный тариф OpenRouter — самый быстрый способ попробовать десять frontier-моделей за $0. Когда вы из него вырастете, Hypereal — самый дешёвый платный вариант с самым широким каталогом моделей, включая те, за которые OpenRouter берёт полную цену.