2026 OpenRouter: недельный рейтинг токенов
Billing-данные не врут

28,9T недельный throughput · сдвиг Китай–США · матрица DeepSeek · доля токенов vs выручки

Недельный рейтинг OpenRouter 2026 и структура рынка по billing-данным
Если команда выбирает модели по MMLU, а месячный API-счёт рассказывает другую историю, недельный рейтинг токенов OpenRouter даёт более честный сигнал. Он отслеживает 7-дневный rolling реальный throughput, а не лабораторные заявления вендоров. Гид для владельцев API routing и AI platform lead. На окне 18–24 мая 2026 вы получите: (1) сравнение billing vs benchmark; (2) 28,9T глобального недельного объёма и долю Китай–США; (3) Top 10 той недели и матрицу моделей DeepSeek; (4) расклад доля токенов vs доля выручки; (5) шестишаговый runbook недельного отслеживания; (6) три цитируемые точки данных и рекомендации по хосту.
01

Benchmark leaderboard vs billing throughput: что отражает реальное внедрение ИИ?

Вывод сразу: для production routing недельный billing побеждает статические бенчмарки. OpenRouter агрегирует 300+ моделей от 60+ провайдеров, обслуживает 8M+ пользователей и обрабатывает порядка 100T токенов в месяц. Leaderboard ранжирует по 7-дневному rolling input+output tokens — фактически оплаченному usage, а не self-reported скорам.

01

Слепая зона бенчмарков: Высокоскоринговые модели с нестабильным API или экстремальным pricing теряют трафик быстро. Leaderboard не фиксирует эту миграцию.

02

Честность billing: Каждый токен мапится на compute и spend. Throughput — термометр рынка для adoption.

03

Сдвиг agent-эры: OpenRouter и AI Usage Report a16z за 2025 (100T анонимизированных токенов) показали: benchmark scores и market share почти обратно коррелируют. Команды оптимизируют cost и стабильность API.

04

Mix use-case: Coding вырос с ~11% трафика в начале 2025 до свыше 50% — крупнейшая категория. Это объясняет недельное доминирование DeepSeek.

Недельный объём платформы вырос с ~2,4T токенов год назад до 28,9T в окне 18–24 мая — примерно 12× годовой скачок. Недельные observation windows важнее, чем когда-либо.

02

Как читать недельную статистику OpenRouter: декодирование 28,9T за 18–24 мая

На openrouter.ai/rankings важны четыре измерения: недельный итог токенов, ранг модели, доля провайдера и пара доля выручки в долларах vs доля токенов. Последняя пара вскрывает pricing-driven «двойную правду». Сводка за последнюю полную неделю:

МетрикаЗначениеWoWИнтерпретация
Глобальные недельные токены28,9T+7,4%Пятый рост подряд
Китайские модели9,223T+19,89%Опережает глобальное среднее
Американские модели4,93T+16,27%Растут в абсолюте, теряют долю
Ранг Китай vs СШАКитай #1 четвёртую неделюВпервые обогнал США в фев 2026
ТаймлайнДоля трафика китайских моделейПримечание
Начало 2025< 2%Незначительно
Фев 2026Впервые обогнал СШАТочка перелома
Май 2026~45%+Четвёртая неделя на #1

Token throughput перестал быть чисто технической метрикой — стал коммерческим барометром: инвесторы, билдеры и медиа голосуют одним недельным чартом.

03

Top 10 за 18–24 мая: как трёхмодельная матрица DeepSeek захватила лидерство

Три варианта DeepSeek попали в top nine. Совокупный объём серии — 5,74T токенов (+25,9% WoW), вторую неделю подряд обгоняя Anthropic и Google на уровне провайдера.

#МодельВендорНедельные токеныWoWРоль
1DeepSeek-V4-FlashDeepSeek3,43T+66%Agent default, ultra-low price
2Tencent Hy3 PreviewTencent3,07T+16%Рост после free-tier
3Claude Sonnet 4.6Anthropic1,35T1M context, enterprise coding
4DeepSeek-V3.2DeepSeek1,31TLow-cost long tail
5Owl AlphaOpenRouter1,15T+29%Бесплатный Agent-specialized
6Gemini 3 Flash PreviewGoogle1,06TMultimodal, academic
7DeepSeek-V4-ProDeepSeek1,00TFlagship (5,74T серии)
8MiniMax M2.7MiniMax806BLong-context value
9Grok 4.1 FastxAI721B2M context, legal workflows
10Step 3.5 FlashStepFun673BFast batch processing

Три tier: high-value / low-volume (Claude Opus для сложного enterprise reasoning); mid-cost / mid-volume (Gemini Flash для multimodal); ultra-low-cost / high-volume (DeepSeek, MiniMax, StepFun для агентов и batch jobs). Парадокс премиума Anthropic: ~12% доли токенов (было 25% год назад), но ~46% доли выручки в долларах. Claude Opus 4.6 один генерирует ~$25M/мес, двигая долю токенов DeepSeek.

Примечание: Kimi K2.6 выпал из top 10 после #6 на прошлой неделе. Объём V4-Pro выведен из 5,74T серии минус V4-Flash и V3.2. Перекрёстная проверка с публичными данными OpenRouter и прессой от 25 мая 2026.

04

Шестишаговый runbook: отслеживать недельный рейтинг OpenRouter и корректировать routing

01

Фиксированный cadence: Каждый понедельник открывайте openrouter.ai/rankings, скриншот 7-дневных рангов и долей провайдеров, внутренний архив.

02

Сверка со счётом: Экспорт инвойсов OpenRouter или вендора. Если ваш token mix резко расходится с глобальным недельным рейтингом — routing устарел.

03

Routing по task tier: Агенты и batch jobs — DeepSeek-V4-Flash; сложный enterprise reasoning — Claude Opus; multimodal — Gemini Flash.

04

Следить за новичками: Всплески Hy3 Preview и Owl Alpha часто предшествуют следующей default-модели. Запускайте 5% shadow traffic A/B.

05

Разделять долю токенов и выручки: High-token / low-revenue модели масштабируются дёшево; high-revenue — на critical paths.

06

Привязать стабильный host: Routing logic ломается, если ноутбук засыпает на OAuth refresh или задыхается от параллельных dev-серверов. Gateway — на 24/7 cloud Mac host, недельные review вшить в SOP.

05

Три цитируемые точки данных за недельным чартом

A

12× годовой рост: Недельный объём платформы вырос с ~2,4T до 28,9T. При заявленной оценке 26× PS недельный чарт — core investor signal для коммерциализации ИИ.

B

Доминирование coding: Coding превышает 50% трафика OpenRouter (vs ~11% в начале 2025) — объясняет недельную корону V4-Flash с 3,43T: агенты ценят unit economics выше peak reasoning scores.

C

Скорость разворота Китай–США: Доля китайских моделей выросла с <2% до ~45%+ менее чем за 18 месяцев — open ultra-low-cost API перестраивают глобальные call patterns.

Осторожно: Недельные цифры колеблются ежедневно. Статья использует данные по 2026-05-24. Бесплатные модели вроде Owl Alpha — для прототипов; перед production проверьте privacy terms.

Multi-model agent routing на личном Mac даёт sleep disconnects, memory pressure от параллельных dev-серверов и сбои OAuth refresh. VPS не даёт нативный Apple Silicon для Xcode и iOS CI. Для 24/7 Gateway uptime, параллельных dev-серверов и multi-region API routing аренда cloud Mac Mini MESHLAUNCH — обычно лучший production-выбор: выделенный Apple Silicon, гибкие daily/weekly/monthly terms, замыкание цикла с недельными OpenRouter review. При чтении всего репозитория агентом long-context input tokens растут быстро — tiered routing на cloud host снижает bill shock. Цены аренды, центр помощи; trial — оформить заказ.

FAQ

Бенчмарки тестируют потолок; недельный рейтинг — оплаченный throughput. Используйте оба, но за направлением рынка следите по billing. Варианты Agent host — на странице цен.

V4-Flash — default agent router; V4-Pro — flagship coding; V3.2 — low-cost long tail. Совокупные 5,74T серии задают квоты API key allocation.

Каждый понедельник сверяйте с инвойсами; 5% shadow traffic в течение семи дней после крупных релизов моделей. Проблемы с host — центр помощи.