Какая AI-модель была самой популярной на OpenRouter в июне 2026?

По суточному объёму токенов: DeepSeek V4 Flash (619B), затем Tencent Hy3 Preview (451B), MiniMax M3 (447B), Xiaomi MiMo-V2.5 (327B).

DeepSeek лучше Claude?

Зависит от сценария. DeepSeek лидирует по объёму, Claude Opus 4.8 — #1 по качеству (61.4). Для ежедневного кодинга DeepSeek очень выгоден; для сложных агентов и long context — Claude.

Почему у китайских моделей такая высокая доля на OpenRouter?

Цена, скорость и достаточное качество. MiniMax M3 — $0.60/M, ~1/8 от Claude Opus 4.8; 80–90% качества top-моделей для кодинга, перевода, саммари; open weights для self-hosting.

Рейтинг AI-моделей июнь 2026: китайские модели «захватили» OpenRouter

Q: Какие frontier-модели выйдут в Q3 2026?

Вероятно GPT-6 (авг–сен.), Claude Opus 5 (~сен.), Gemini 4, DeepSeek V5 open weights, плюс уже вышедший GLM 5.2.

Q: Как построить AI-среду с переключаемыми моделями?

OpenRouter или LiteLLM как единый роут, маршрутизация по сложности: closed-source frontier для 5% сложнейших задач, китайские open weights для 95% объёма; agent gateway на стабильном cloud Mac 7×24.

В июне 2026 реальный трафик OpenRouter показал тихую революцию: китайские модели — ~61% token-трафика разработчиков, а доля US-тройки (Google + OpenAI + Anthropic) за год упала с 70% до 30%. При этом Claude Opus 4.8 держит потолок качества — 61.4 балла, а Claude Fable 5 снят глобально в середине июня из‑за экспортного контроля. Для команд с OpenRouter-роутингом: ① полные рейтинги компаний и моделей за июнь; ② объём vs качество; ③ матрица восьми сценариев; ④ прогнозы Q3 и пять макротрендов; ⑤ шестишаговый model-agnostic runbook.

Рейтинг OpenRouter за июнь: компании и модели

OpenRouter агрегирует реальные API-вызовы миллионов разработчиков — не пресс-релизы, а голос кода. Июньский список отражает, каким моделям доверяют в проде в США, Европе и Индии.

Место	Компания	Страна	Tokens/нед.	Доля
1	DeepSeek	🇨🇳 Китай	5.13T	17.6%
2	Anthropic	🇺🇸 США	4.34T	14.8%
3	Google	🇺🇸 США	3.66T	12.5%
4	OpenAI	🇺🇸 США	2.46T	8.4%
5	Xiaomi	🇨🇳 Китай	2.42T	8.3%
6	MiniMax	🇨🇳 Китай	2.37T	8.1%
7	Tencent	🇨🇳 Китай	2.36T	8.1%
8	Alibaba Qwen	🇨🇳 Китай	1.26T	4.3%

Китайские вендоры в top-10 — ~46%; с учётом всех китайских моделей трафик разработчиков ~61%.

Место	Модель	Вендор	Tokens/день
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Перелом: Bloomberg цитирует OpenRouter: US-модели с 70% (июнь 2025) до 30% (июнь 2026) — 40 п.п. ушло китайским моделям.

Не «патриотизм»: база OpenRouter глобальна; DeepSeek, Xiaomi и MiniMax выигрывают — дешевле, быстрее, достаточно хороши.

Экономика: разработчик из Сан-Дiego: «С Claude кодинг ~$10/час. С DeepSeek — меньше 50 центов.»

Июнь: Claude Fable 5 снят (экспорт); OpenAI и Anthropic сигнализируют IPO.

Смысл: не «у кого больше пользователей», а кому доверяют в проде.

Это не история качества — для большинства daily workload это экономика.

Лидер по объёму ≠ лидер по качеству: Claude Opus 4.8 #1

Объём токенов и benchmark-качество в 2026 — разные измерения.

Модель	Intelligence Index	SWE-bench Pro	Примечание
Claude Opus 4.8	61.4 (#1)	69.2%	Long context и агенты
GPT-5.5	59–60	63.1%	Экосистема, быстрые tool calls
Gemini 3.1 Pro	57	—	Сложнейший reasoning
Qwen 3.7 Max	57	—	Top closed-source Китая
Claude Sonnet 4.6	—	80.8% (Verified)	Тексты и instruction-following

Источник: Artificial Analysis Intelligence Index (конец мая 2026). 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; в long context Opus доминирует.

Claude Fable 5: максимальный рейтинг качества (100/100), но снят глобально в середине июня 2026 (экспортный контроль) — статус неясен. US frontier по чистой способности всё ещё впереди.

Три причины высокого китайского объёма:

Цена: MiniMax M3 — $0.60/M input, ~1/8 от Claude Opus 4.8 ($5.00/M).

Достаточно: помощь в коде, completion, перевод, summary — 80–90% top-качества.

Open weights: DeepSeek V4, MiniMax M3 и др. — self-hosting, меньше рисков трансграничной передачи данных.

Лучшая модель по сценарию — матрица июнь 2026

Сценарий	Модель	Почему
Сложный код / agent	Claude Opus 4.8	#1 overall, long context
Ежедневный кодинг	DeepSeek V4 Flash / MiMo-V2.5	Цена/качество
Самый дешёвый API	MiniMax M3	$0.60/M, open weights
Long context	Kimi K2.6 (1M context)	Длинное окно, fair price
Google-экосистема	Gemini 3.5 Flash	Нативный Workspace
Web в реальном времени	Grok 4.3	Live X/Twitter
Self-hosting	GLM 5.2 / Kimi K2.6	Top open weights
Генерация изображений	ChatGPT Images 2.0	Лучший текст на картинке

Разумная стратегия: closed-source frontier для 5% сложнейших задач, китайские open weights для 95% объёма. Середина «норм, но дорого» быстро исчезает.

Multi-model AI-архитектура — runbook из 6 шагов

Единый роут: OpenRouter или LiteLLM — один API endpoint, без hardcode провайдера.

Уровни задач: простой completion/summary → DeepSeek V4 Flash или MiMo-V2.5; multi-step agent/long context → Claude Opus 4.8.

Контроль затрат: tokens и USD по моделям, алерты бюджета; MiniMax M3 ($0.60/M) — baseline для daily.

Fallback-цепочка: timeout/rate limit → Opus → Sonnet → DeepSeek V4 Pro — agent workflows не падают.

Open-weights fallback: чувствительные данные → GLM 5.2 или Kimi K2.6 self-hosted, без трансграничных prompt-передач.

Стабильный хост: agent gateway и routing на cloud Mac Mini 7×24 — ноутбук не усыпляет long-running agents.

OpenRouter routing

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -d '{
    "model": "deepseek/deepseek-v4-flash",
    "messages": [{"role": "user", "content": "Refactor this function..."}]
  }'

Прогнозы H2 2026: окно Q3 и пять макротрендов

Q3 2026 может стать самым плотным кварталом релизов в истории AI:

Модель	Вендор	Срок	Фокус
GPT-6	OpenAI	авг–сен. 2026	Длиннее context (слух 1.5M), сильнее agents
Claude Opus 5	Anthropic	~сен. 2026	Long-running agents
Gemini 4	Google	Q3 2026	Multimodal video/audio
DeepSeek V5	DeepSeek	Q3 2026	Open weights, >1T params, frontier level
GLM 5.2	Z.ai	Уже вышел	Top open weights, сильный coding

Конкуренция по сценариям: пять labs за 90 дней — больше нет одного «лучшего»; frontier 5%, open weights 95%.

Доля Китая растёт, compliance ограничивает enterprise: безопасность данных и Конгресс США; indie devs возможно 70%+, Fortune 500 <30%.

Agents — главное поле боя: отчёт Anthropic 2026: 44% Claude API calls — математика и CS.

IPO и цены: OpenAI и Anthropic в июне сигнализировали IPO — давление листинга, tiered pricing, ценовая война с Китаем.

Локальные модели: к 2027 SWE-bench 80% на consumer GPU (32GB RAM).

DeepSeek tokens/нед.: 5.13T, 17.6%, #1 среди компаний.

Разворот US: 70% → 30% за 12 месяцев (Bloomberg / OpenRouter).

Разрыв цен: MiniMax M3 vs Opus 4.8 input ~8× ($0.60/M vs $5.00/M).

Суть: маржа model layer быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier compute. US-вендоры расходятся — OpenAI экосистема, Anthropic качество, Google скорость/multimodal. Для разработчиков важнее не «выбрать сильнейшую модель», а архитектура с переключением моделей — #1 сегодня может уйти через три месяца.

Multi-model routing на ноутбуке — sleep, RAM, сеть. Для agent gateway, OpenClaw или multi-model CI 7×24 — MESHLAUNCH Mac Mini cloud bare-metal: выделенный Apple Silicon, аренда день/неделя/месяц. Регион и setup — центр помощи.

FAQ

DeepSeek V4 Flash — 619B/день, затем Tencent Hy3 Preview (451B), MiniMax M3 (447B), Xiaomi MiMo-V2.5 (327B). Полные таблицы выше.

Зависит от сценария. DeepSeek лидирует по объёму; Opus 4.8 — #1 качества (61.4). Daily coding: DeepSeek <50¢/ч vs Claude ~$10. Agents/long context: Claude. См. цены аренды.

Вероятно GPT-6 (авг–сен.), Claude Opus 5 (~сен.), Gemini 4, DeepSeek V5 open weights. Три US labs + DeepSeek могут релизить за ~6 недель — стройте model-agnostic route заранее.

Цена ($0.60/M MiniMax M3 vs $5.00/M Opus 4.8), скорость, 80–90% качества для daily tasks. Open weights — self-hosting без US cloud prompts.

OpenRouter/LiteLLM на cloud Mac 7×24. Конфиг и регион: центр помощи; аренда день/месяц по проекту.

К списку блога Арендовать

Рейтинг AI-моделей июнь 2026Китай «захватил» OpenRouter · Ставки на H2

Рейтинг OpenRouter за июнь: компании и модели

Лидер по объёму ≠ лидер по качеству: Claude Opus 4.8 #1

Лучшая модель по сценарию — матрица июнь 2026

Multi-model AI-архитектура — runbook из 6 шагов

Прогнозы H2 2026: окно Q3 и пять макротрендов

Рейтинг AI-моделей июнь 2026
Китай «захватил» OpenRouter · Ставки на H2