2026 Classement hebdomadaire OpenRouter
Les données de facturation ne mentent pas

28,9T de débit hebdomadaire · bascule Chine–États-Unis · matrice DeepSeek · parts tokens vs dollars

Classement hebdomadaire OpenRouter 2026 et structure du marché de facturation
Si votre équipe choisit ses modèles d’après les scores MMLU alors que la facture API mensuelle raconte une autre histoire, les classements hebdomadaires de tokens OpenRouter offrent un signal plus honnête. Ils suivent le débit réel sur 7 jours glissants, pas les annonces de laboratoire des éditeurs. Ce guide s’adresse aux responsables de routage API et aux leads plateforme IA. Sur la fenêtre du 18 au 24 mai 2026, vous obtenez : (1) une comparaison facturation vs benchmarks ; (2) le volume hebdomadaire global de 28,9T et la part Chine–États-Unis ; (3) le Top 10 de cette semaine et la matrice de modèles DeepSeek ; (4) la répartition part en tokens vs part en revenus en dollars ; (5) un runbook de suivi hebdomadaire en six étapes ; (6) trois points de données citables et des recommandations d’hébergement.
01

Benchmarks vs débit de facturation : lequel reflète l’adoption réelle de l’IA ?

Conclusion d’abord : pour le routage en production, la facturation hebdomadaire l’emporte sur les benchmarks statiques. OpenRouter agrège plus de 300 modèles de plus de 60 fournisseurs, sert plus de 8 millions d’utilisateurs et traite environ 100T de tokens par mois. Son leaderboard classe par tokens d’entrée et de sortie sur 7 jours glissants — usage payé réel, pas scores auto-déclarés.

01

Angle mort des benchmarks : Les modèles très bien notés mais avec API instables ou tarifs extrêmes perdent du trafic vite. Les leaderboards ne capturent pas cette migration.

02

Honnêteté de la facturation : Chaque token correspond à du calcul et de la dépense. Le débit est le thermomètre du marché pour l’adoption.

03

Bascule ère Agent : OpenRouter et le rapport d’usage IA 2025 d’a16z (100T de tokens anonymisés) montrent que scores de benchmark et parts de marché sont quasi inversement corrélés. Les équipes optimisent coût et stabilité API.

04

Mix d’usage : Le code est passé d’environ 11 % du trafic début 2025 à plus de 50 % — la plus grande catégorie unique. Cela explique la domination hebdomadaire de DeepSeek.

Le volume hebdomadaire de la plateforme est passé d’environ 2,4T de tokens il y a un an à 28,9T sur la fenêtre du 18–24 mai — une hausse annuelle d’environ 12×. Les fenêtres d’observation hebdomadaires comptent plus que jamais.

02

Lire les statistiques hebdomadaires OpenRouter : décoder les 28,9T du 18–24 mai

Sur openrouter.ai/rankings, quatre dimensions comptent : total hebdomadaire de tokens, rang par modèle, part de marché par fournisseur, et part en revenus en dollars vs part en tokens. Cette dernière paire expose la « double vérité » dictée par les prix. Synthèse pour la dernière semaine complète :

MétriqueValeurSem./sem.Lecture
Tokens hebdomadaires mondiaux28,9T+7,4 %Cinquième hausse hebdomadaire consécutive
Modèles d’origine chinoise9,223T+19,89 %Dépasse la moyenne mondiale
Modèles d’origine américaine4,93T+16,27 %Croissance absolue, perte de part
Rang Chine vs États-UnisChine #1 depuis 4 semainesPremière dépassement des États-Unis en fév. 2026
ChronologiePart de trafic modèles chinoisNote
Début 2025< 2 %Négligeable
Fév. 2026Premier dépassement des États-UnisPoint d’inflexion
Mai 2026~45 %+Quatrième semaine au #1

Le débit de tokens est passé de métrique technique à baromètre commercial — investisseurs, builders et médias votent désormais sur le même graphique hebdomadaire.

03

Top 10 du 18–24 mai : comment la matrice trois modèles DeepSeek a pris la tête

Trois variantes DeepSeek figurent dans le top neuf. Le volume combiné de la série atteint 5,74T de tokens (+25,9 % sem./sem.), battant Anthropic et Google pour la deuxième semaine consécutive au niveau fournisseur.

#ModèleÉditeurTokens hebdo.Sem./sem.Rôle
1DeepSeek-V4-FlashDeepSeek3,43T+66 %Défaut Agent, prix ultra-bas
2Tencent Hy3 PreviewTencent3,07T+16 %Croissance post-gratuité
3Claude Sonnet 4.6Anthropic1,35TContexte 1M, code entreprise
4DeepSeek-V3.2DeepSeek1,31TLongue traîne low-cost
5Owl AlphaOpenRouter1,15T+29 %Gratuit, spécialisé Agent
6Gemini 3 Flash PreviewGoogle1,06TMultimodal, académique
7DeepSeek-V4-ProDeepSeek1,00TFlagship (5,74T total série)
8MiniMax M2.7MiniMax806BLong contexte, bon rapport qualité-prix
9Grok 4.1 FastxAI721BContexte 2M, workflows juridiques
10Step 3.5 FlashStepFun673BTraitement batch rapide

Trois niveaux émergent : haute valeur / faible volume (Claude Opus pour raisonnement entreprise complexe) ; coût moyen / volume moyen (Gemini Flash pour multimodal) ; ultra-low-cost / haut volume (DeepSeek, MiniMax, StepFun pour agents et jobs batch). Le paradoxe premium d’Anthropic : ~12 % de part en tokens (contre 25 % il y a un an) mais ~46 % de part en revenus en dollars. Claude Opus 4.6 seul génère ~25 M$/mois tout en traitant une fraction des tokens de DeepSeek.

Note : Kimi K2.6 est sorti du top 10 après avoir été #6 la semaine précédente. Le volume V4-Pro est dérivé du total série 5,74T moins V4-Flash et V3.2. Recoupement avec les données publiques OpenRouter et la couverture presse du 25 mai 2026.

04

Runbook en six étapes : suivre les classements hebdomadaires OpenRouter et ajuster le routage

01

Cadence fixe : Chaque lundi, ouvrir openrouter.ai/rankings, capturer les rangs 7 jours et parts fournisseurs, archiver en interne.

02

Rapprocher vos factures : Exporter les factures OpenRouter ou éditeurs. Si votre mix de tokens diverge fortement des rangs hebdomadaires mondiaux, le routage est peut-être obsolète.

03

Router par niveau de tâche : Agents et jobs batch vers DeepSeek-V4-Flash ; raisonnement entreprise complexe vers Claude Opus ; multimodal vers Gemini Flash.

04

Surveiller les nouveaux entrants : Les poussées Hy3 Preview et Owl Alpha précèdent souvent le prochain modèle par défaut. Lancer des tests A/B shadow à 5 %.

05

Séparer part tokens et part revenus : Modèles à fort volume / faible revenu pour scaler à moindre coût ; modèles à fort revenu sur les chemins critiques.

06

Fixer un hôte stable : La logique de routage échoue si un MacBook s’endort pendant un refresh OAuth ou étouffe sous des serveurs de dev parallèles. Placer les passerelles sur des Mac cloud 24/7 et intégrer les revues hebdomadaires au SOP.

05

Trois points de données citables derrière le graphique hebdomadaire

A

Croissance annuelle 12× : Le volume hebdomadaire de la plateforme est passé d’environ 2,4T à 28,9T. Avec une valorisation rapportée à 26× PS, le graphique hebdomadaire est devenu un signal investisseur central pour la commercialisation de l’IA.

B

Le code domine : Le code dépasse 50 % du trafic OpenRouter (contre ~11 % début 2025), expliquant la couronne hebdomadaire de V4-Flash à 3,43T — les agents privilégient l’économie unitaire aux scores de raisonnement maximal.

C

Vitesse du renversement Chine–États-Unis : La part d’origine chinoise est passée de <2 % à ~45 %+ en moins de 18 mois — des API ouvertes ultra-low-cost remodèlent les schémas d’appels mondiaux.

Prudence : Les chiffres hebdomadaires fluctuent quotidiennement. Cet article s’appuie sur les données jusqu’au 2026-05-24. Les modèles gratuits comme Owl Alpha conviennent aux prototypes ; vérifier les conditions de confidentialité avant la production.

Faire tourner un routage multi-modèles d’agents sur un Mac personnel introduit des déconnexions en veille, une pression mémoire due aux serveurs de dev parallèles et des échecs de refresh OAuth. Les VPS n’offrent pas de Apple Silicon natif pour Xcode et la CI iOS. Pour les workflows créatifs — Final Cut, Logic, builds Xcode et passerelles OpenClaw en parallèle — un MacBook 16 Go en veille casse les LaunchAgents et les pipelines d’automation.

Pour une disponibilité Gateway 24/7, des serveurs de dev parallèles et un routage API multi-régions, la location cloud Mac Mini MESHLAUNCH est en général le meilleur choix de production : Apple Silicon dédié, formules journalières/hebdomadaires/mensuelles flexibles, bouclant la boucle avec les revues hebdomadaires OpenRouter. Consultez les tarifs de location, le centre d’aide pour régions et réseau ; essai via la page de commande.

FAQ

Les benchmarks testent les plafonds ; les rangs hebdomadaires suivent le débit payé. Utilisez les deux, mais suivez la facturation pour la direction du marché. Voir notre page tarifs pour les options d’hôte Agent.

V4-Flash comme routeur Agent par défaut ; V4-Pro pour le code flagship ; V3.2 pour la longue traîne low-cost. Le total série 5,74T peut guider l’allocation des quotas de clés API.

Revue chaque lundi face à vos factures ; lancer 5 % de trafic shadow dans les sept jours suivant les lancements majeurs. Problèmes d’hôte : centre d’aide.