Рейтинг AI-моделей июнь 2026
Китай «захватил» OpenRouter · Ставки на H2

Реальный трафик OpenRouter · US 70%→30% · Claude Opus 4.8 качество · волна Q3

Анализ рейтинга AI-моделей OpenRouter июнь 2026
В июне 2026 реальный трафик OpenRouter показал тихую революцию: китайские модели — ~61% token-трафика разработчиков, а доля US-тройки (Google + OpenAI + Anthropic) за год упала с 70% до 30%. При этом Claude Opus 4.8 держит потолок качества — 61.4 балла, а Claude Fable 5 снят глобально в середине июня из‑за экспортного контроля. Для команд с OpenRouter-роутингом: ① полные рейтинги компаний и моделей за июнь; ② объём vs качество; ③ матрица восьми сценариев; ④ прогнозы Q3 и пять макротрендов; ⑤ шестишаговый model-agnostic runbook.
01

Рейтинг OpenRouter за июнь: компании и модели

OpenRouter агрегирует реальные API-вызовы миллионов разработчиков — не пресс-релизы, а голос кода. Июньский список отражает, каким моделям доверяют в проде в США, Европе и Индии.

МестоКомпанияСтранаTokens/нед.Доля
1DeepSeek🇨🇳 Китай5.13T17.6%
2Anthropic🇺🇸 США4.34T14.8%
3Google🇺🇸 США3.66T12.5%
4OpenAI🇺🇸 США2.46T8.4%
5Xiaomi🇨🇳 Китай2.42T8.3%
6MiniMax🇨🇳 Китай2.37T8.1%
7Tencent🇨🇳 Китай2.36T8.1%
8Alibaba Qwen🇨🇳 Китай1.26T4.3%

Китайские вендоры в top-10 — ~46%; с учётом всех китайских моделей трафик разработчиков ~61%.

МестоМодельВендорTokens/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B
01

Перелом: Bloomberg цитирует OpenRouter: US-модели с 70% (июнь 2025) до 30% (июнь 2026) — 40 п.п. ушло китайским моделям.

02

Не «патриотизм»: база OpenRouter глобальна; DeepSeek, Xiaomi и MiniMax выигрывают — дешевле, быстрее, достаточно хороши.

03

Экономика: разработчик из Сан-Дiego: «С Claude кодинг ~$10/час. С DeepSeek — меньше 50 центов.»

04

Июнь: Claude Fable 5 снят (экспорт); OpenAI и Anthropic сигнализируют IPO.

05

Смысл: не «у кого больше пользователей», а кому доверяют в проде.

Это не история качества — для большинства daily workload это экономика.

02

Лидер по объёму ≠ лидер по качеству: Claude Opus 4.8 #1

Объём токенов и benchmark-качество в 2026 — разные измерения.

МодельIntelligence IndexSWE-bench ProПримечание
Claude Opus 4.861.4 (#1)69.2%Long context и агенты
GPT-5.559–6063.1%Экосистема, быстрые tool calls
Gemini 3.1 Pro57Сложнейший reasoning
Qwen 3.7 Max57Top closed-source Китая
Claude Sonnet 4.680.8% (Verified)Тексты и instruction-following

Источник: Artificial Analysis Intelligence Index (конец мая 2026). 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; в long context Opus доминирует.

Claude Fable 5: максимальный рейтинг качества (100/100), но снят глобально в середине июня 2026 (экспортный контроль) — статус неясен. US frontier по чистой способности всё ещё впереди.

Три причины высокого китайского объёма:

A

Цена: MiniMax M3 — $0.60/M input, ~1/8 от Claude Opus 4.8 ($5.00/M).

B

Достаточно: помощь в коде, completion, перевод, summary — 80–90% top-качества.

C

Open weights: DeepSeek V4, MiniMax M3 и др. — self-hosting, меньше рисков трансграничной передачи данных.

03

Лучшая модель по сценарию — матрица июнь 2026

СценарийМодельПочему
Сложный код / agentClaude Opus 4.8#1 overall, long context
Ежедневный кодингDeepSeek V4 Flash / MiMo-V2.5Цена/качество
Самый дешёвый APIMiniMax M3$0.60/M, open weights
Long contextKimi K2.6 (1M context)Длинное окно, fair price
Google-экосистемаGemini 3.5 FlashНативный Workspace
Web в реальном времениGrok 4.3Live X/Twitter
Self-hostingGLM 5.2 / Kimi K2.6Top open weights
Генерация изображенийChatGPT Images 2.0Лучший текст на картинке

Разумная стратегия: closed-source frontier для 5% сложнейших задач, китайские open weights для 95% объёма. Середина «норм, но дорого» быстро исчезает.

04

Multi-model AI-архитектура — runbook из 6 шагов

01

Единый роут: OpenRouter или LiteLLM — один API endpoint, без hardcode провайдера.

02

Уровни задач: простой completion/summary → DeepSeek V4 Flash или MiMo-V2.5; multi-step agent/long context → Claude Opus 4.8.

03

Контроль затрат: tokens и USD по моделям, алерты бюджета; MiniMax M3 ($0.60/M) — baseline для daily.

04

Fallback-цепочка: timeout/rate limit → Opus → Sonnet → DeepSeek V4 Pro — agent workflows не падают.

05

Open-weights fallback: чувствительные данные → GLM 5.2 или Kimi K2.6 self-hosted, без трансграничных prompt-передач.

06

Стабильный хост: agent gateway и routing на cloud Mac Mini 7×24 — ноутбук не усыпляет long-running agents.

OpenRouter routing
curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -d '{
    "model": "deepseek/deepseek-v4-flash",
    "messages": [{"role": "user", "content": "Refactor this function..."}]
  }'
05

Прогнозы H2 2026: окно Q3 и пять макротрендов

Q3 2026 может стать самым плотным кварталом релизов в истории AI:

МодельВендорСрокФокус
GPT-6OpenAIавг–сен. 2026Длиннее context (слух 1.5M), сильнее agents
Claude Opus 5Anthropic~сен. 2026Long-running agents
Gemini 4GoogleQ3 2026Multimodal video/audio
DeepSeek V5DeepSeekQ3 2026Open weights, >1T params, frontier level
GLM 5.2Z.aiУже вышелTop open weights, сильный coding
1

Конкуренция по сценариям: пять labs за 90 дней — больше нет одного «лучшего»; frontier 5%, open weights 95%.

2

Доля Китая растёт, compliance ограничивает enterprise: безопасность данных и Конгресс США; indie devs возможно 70%+, Fortune 500 <30%.

3

Agents — главное поле боя: отчёт Anthropic 2026: 44% Claude API calls — математика и CS.

4

IPO и цены: OpenAI и Anthropic в июне сигнализировали IPO — давление листинга, tiered pricing, ценовая война с Китаем.

5

Локальные модели: к 2027 SWE-bench 80% на consumer GPU (32GB RAM).

A

DeepSeek tokens/нед.: 5.13T, 17.6%, #1 среди компаний.

B

Разворот US: 70% → 30% за 12 месяцев (Bloomberg / OpenRouter).

C

Разрыв цен: MiniMax M3 vs Opus 4.8 input ~ ($0.60/M vs $5.00/M).

Суть: маржа model layer быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier compute. US-вендоры расходятся — OpenAI экосистема, Anthropic качество, Google скорость/multimodal. Для разработчиков важнее не «выбрать сильнейшую модель», а архитектура с переключением моделей — #1 сегодня может уйти через три месяца.

Multi-model routing на ноутбуке — sleep, RAM, сеть. Для agent gateway, OpenClaw или multi-model CI 7×24 — MESHLAUNCH Mac Mini cloud bare-metal: выделенный Apple Silicon, аренда день/неделя/месяц. Регион и setup — центр помощи.

FAQ

DeepSeek V4 Flash — 619B/день, затем Tencent Hy3 Preview (451B), MiniMax M3 (447B), Xiaomi MiMo-V2.5 (327B). Полные таблицы выше.

Зависит от сценария. DeepSeek лидирует по объёму; Opus 4.8 — #1 качества (61.4). Daily coding: DeepSeek <50¢/ч vs Claude ~$10. Agents/long context: Claude. См. цены аренды.

Вероятно GPT-6 (авг–сен.), Claude Opus 5 (~сен.), Gemini 4, DeepSeek V5 open weights. Три US labs + DeepSeek могут релизить за ~6 недель — стройте model-agnostic route заранее.

Цена ($0.60/M MiniMax M3 vs $5.00/M Opus 4.8), скорость, 80–90% качества для daily tasks. Open weights — self-hosting без US cloud prompts.

OpenRouter/LiteLLM на cloud Mac 7×24. Конфиг и регион: центр помощи; аренда день/месяц по проекту.