Рейтинг OpenRouter за июнь: компании и модели
OpenRouter агрегирует реальные API-вызовы миллионов разработчиков — не пресс-релизы, а голос кода. Июньский список отражает, каким моделям доверяют в проде в США, Европе и Индии.
| Место | Компания | Страна | Tokens/нед. | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 Китай | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 США | 4.34T | 14.8% |
| 3 | 🇺🇸 США | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 США | 2.46T | 8.4% |
| 5 | Xiaomi | 🇨🇳 Китай | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 Китай | 2.37T | 8.1% |
| 7 | Tencent | 🇨🇳 Китай | 2.36T | 8.1% |
| 8 | Alibaba Qwen | 🇨🇳 Китай | 1.26T | 4.3% |
Китайские вендоры в top-10 — ~46%; с учётом всех китайских моделей трафик разработчиков ~61%.
| Место | Модель | Вендор | Tokens/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Перелом: Bloomberg цитирует OpenRouter: US-модели с 70% (июнь 2025) до 30% (июнь 2026) — 40 п.п. ушло китайским моделям.
Не «патриотизм»: база OpenRouter глобальна; DeepSeek, Xiaomi и MiniMax выигрывают — дешевле, быстрее, достаточно хороши.
Экономика: разработчик из Сан-Дiego: «С Claude кодинг ~$10/час. С DeepSeek — меньше 50 центов.»
Июнь: Claude Fable 5 снят (экспорт); OpenAI и Anthropic сигнализируют IPO.
Смысл: не «у кого больше пользователей», а кому доверяют в проде.
Это не история качества — для большинства daily workload это экономика.
Лидер по объёму ≠ лидер по качеству: Claude Opus 4.8 #1
Объём токенов и benchmark-качество в 2026 — разные измерения.
| Модель | Intelligence Index | SWE-bench Pro | Примечание |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long context и агенты |
| GPT-5.5 | 59–60 | 63.1% | Экосистема, быстрые tool calls |
| Gemini 3.1 Pro | 57 | — | Сложнейший reasoning |
| Qwen 3.7 Max | 57 | — | Top closed-source Китая |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Тексты и instruction-following |
Источник: Artificial Analysis Intelligence Index (конец мая 2026). 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; в long context Opus доминирует.
Claude Fable 5: максимальный рейтинг качества (100/100), но снят глобально в середине июня 2026 (экспортный контроль) — статус неясен. US frontier по чистой способности всё ещё впереди.
Три причины высокого китайского объёма:
Цена: MiniMax M3 — $0.60/M input, ~1/8 от Claude Opus 4.8 ($5.00/M).
Достаточно: помощь в коде, completion, перевод, summary — 80–90% top-качества.
Open weights: DeepSeek V4, MiniMax M3 и др. — self-hosting, меньше рисков трансграничной передачи данных.
Лучшая модель по сценарию — матрица июнь 2026
| Сценарий | Модель | Почему |
|---|---|---|
| Сложный код / agent | Claude Opus 4.8 | #1 overall, long context |
| Ежедневный кодинг | DeepSeek V4 Flash / MiMo-V2.5 | Цена/качество |
| Самый дешёвый API | MiniMax M3 | $0.60/M, open weights |
| Long context | Kimi K2.6 (1M context) | Длинное окно, fair price |
| Google-экосистема | Gemini 3.5 Flash | Нативный Workspace |
| Web в реальном времени | Grok 4.3 | Live X/Twitter |
| Self-hosting | GLM 5.2 / Kimi K2.6 | Top open weights |
| Генерация изображений | ChatGPT Images 2.0 | Лучший текст на картинке |
Разумная стратегия: closed-source frontier для 5% сложнейших задач, китайские open weights для 95% объёма. Середина «норм, но дорого» быстро исчезает.
Multi-model AI-архитектура — runbook из 6 шагов
Единый роут: OpenRouter или LiteLLM — один API endpoint, без hardcode провайдера.
Уровни задач: простой completion/summary → DeepSeek V4 Flash или MiMo-V2.5; multi-step agent/long context → Claude Opus 4.8.
Контроль затрат: tokens и USD по моделям, алерты бюджета; MiniMax M3 ($0.60/M) — baseline для daily.
Fallback-цепочка: timeout/rate limit → Opus → Sonnet → DeepSeek V4 Pro — agent workflows не падают.
Open-weights fallback: чувствительные данные → GLM 5.2 или Kimi K2.6 self-hosted, без трансграничных prompt-передач.
Стабильный хост: agent gateway и routing на cloud Mac Mini 7×24 — ноутбук не усыпляет long-running agents.
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{
"model": "deepseek/deepseek-v4-flash",
"messages": [{"role": "user", "content": "Refactor this function..."}]
}'
Прогнозы H2 2026: окно Q3 и пять макротрендов
Q3 2026 может стать самым плотным кварталом релизов в истории AI:
| Модель | Вендор | Срок | Фокус |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен. 2026 | Длиннее context (слух 1.5M), сильнее agents |
| Claude Opus 5 | Anthropic | ~сен. 2026 | Long-running agents |
| Gemini 4 | Q3 2026 | Multimodal video/audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights, >1T params, frontier level |
| GLM 5.2 | Z.ai | Уже вышел | Top open weights, сильный coding |
Конкуренция по сценариям: пять labs за 90 дней — больше нет одного «лучшего»; frontier 5%, open weights 95%.
Доля Китая растёт, compliance ограничивает enterprise: безопасность данных и Конгресс США; indie devs возможно 70%+, Fortune 500 <30%.
Agents — главное поле боя: отчёт Anthropic 2026: 44% Claude API calls — математика и CS.
IPO и цены: OpenAI и Anthropic в июне сигнализировали IPO — давление листинга, tiered pricing, ценовая война с Китаем.
Локальные модели: к 2027 SWE-bench 80% на consumer GPU (32GB RAM).
DeepSeek tokens/нед.: 5.13T, 17.6%, #1 среди компаний.
Разворот US: 70% → 30% за 12 месяцев (Bloomberg / OpenRouter).
Разрыв цен: MiniMax M3 vs Opus 4.8 input ~8× ($0.60/M vs $5.00/M).
Суть: маржа model layer быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier compute. US-вендоры расходятся — OpenAI экосистема, Anthropic качество, Google скорость/multimodal. Для разработчиков важнее не «выбрать сильнейшую модель», а архитектура с переключением моделей — #1 сегодня может уйти через три месяца.
Multi-model routing на ноутбуке — sleep, RAM, сеть. Для agent gateway, OpenClaw или multi-model CI 7×24 — MESHLAUNCH Mac Mini cloud bare-metal: выделенный Apple Silicon, аренда день/неделя/месяц. Регион и setup — центр помощи.
DeepSeek V4 Flash — 619B/день, затем Tencent Hy3 Preview (451B), MiniMax M3 (447B), Xiaomi MiMo-V2.5 (327B). Полные таблицы выше.
Зависит от сценария. DeepSeek лидирует по объёму; Opus 4.8 — #1 качества (61.4). Daily coding: DeepSeek <50¢/ч vs Claude ~$10. Agents/long context: Claude. См. цены аренды.
Вероятно GPT-6 (авг–сен.), Claude Opus 5 (~сен.), Gemini 4, DeepSeek V5 open weights. Три US labs + DeepSeek могут релизить за ~6 недель — стройте model-agnostic route заранее.
Цена ($0.60/M MiniMax M3 vs $5.00/M Opus 4.8), скорость, 80–90% качества для daily tasks. Open weights — self-hosting без US cloud prompts.
OpenRouter/LiteLLM на cloud Mac 7×24. Конфиг и регион: центр помощи; аренда день/месяц по проекту.